Db 



I I I I I II I I I I I I I I I I I I I i I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2101 TT CAAAGACAGTT AC CACAACCT ACGT CT CT CCAT CCACGACGT GCC CAGCT CCCT GT GG 2160 



Qy 2206 AAGAGTAAGCT C CTTGT CAGCT AC CAGGAGAT CCCCTTTT AT CACAT CT GGAAT GGCACG 2265 

Mill I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 AAGAGCAAGCT ACTT GT CAGCTAC CAGGAGAT C CCTTTT T AC CACAT CT GGAAC GGCACC 2220 

Qy 2266 CAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTG 2325 

I M I III I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I II I I I I II 
Db 2221 CAGCAGTAT CTGCACTGCACCTTCACCCT GGAGCGCATCAACGCCAGCACCAGCGACCTG 2280 

Qy 2326 GC CT GCAAGCT GT GGGT GT GGCAGGT GGAGGGC GAC GGGC AGAGCT T CAGCAT CAACTT C 2385 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I 

Db 2281 GCCTGCAAGGTGTGGGTGTGGCAGGTGGAGGGAGATGGGCAGAGCTTCAACATCAACTTC 2340 

Qy 2386 AACAT CAC CAAGGAC ACAAGGTTT GCT GAGCTGCT GGCT CT GGAGAGT GAAGC GGGGGTC 2445 

II I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2341 AACATCACTAAGGACACAAGGTTTGCTGAATTGTTGGCTCTGGAGAGTGAAGGGGGGGTC 2400 

Qy 2446 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATT 2505 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 2401 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAAAAGATCATC 24 60 

Qy 2506 TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 2565 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2461 GCCAGTCTGGACCCACCCTGCAGCCGGGGCGCCGACTGGAGAACTCTAGCCCAGAAACTT 2520 

Qy 2566 CAC CTGGAC AGCC AT CT CAGCTT CT T T GCCT CCAAGCCCAGCCC C ACAGC CAT GAT C CT C 2625 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 2521 CACCTGGACAGCCATCTTAGCTTCTTTGCCTCCAAGCCCAGCCCTACAGCCATGATCCTC 2580 

Qy 2626 AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 2685 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 2581 AACCTATGGGAGGCACGGCACTTCCCCAACGGCAACCTCGGCCAGCTGGCAGCAGCTGTG 2640 

Qy 2686 GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGC 2745 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 2641 GC C GGACT GGGC CAACCAGAT GCT GGCCT CTTCAC GGT GT CGGAGGC CGAGT GTT GAGAC 27 00 

Qy 2746 CGGCCAG 2752 

I I I I I I 

Db 2701 CAGCCAG 2707 



RESULT 2 

US-09-306-902A-1 

; Sequence 1, Application US/09306902A 

; Patent No. 6277585 

; GENERAL INFORMATION: 

APPLICANT: Tessier-Lavigne, Marc 
; Leonardo, E. David 

; Hink, Lindsay 

; Masu, Masayuki 

; Kazuko, Keino-Masu 

TITLE OF INVENTION: Netrin Receptors 

NUMBER OF SEQUENCES: 9 
; CORRESPONDENCE ADDRESS: 



ADDRESSEE: SCIENCE & TECHNOLOGY LAW GROUP 

STREET: 268 BUSH STREET, SUITE 3200 

CITY: SAN FRANCISCO 
; STATE: CALIFORNIA 

COUNTRY: USA 

ZIP: 94104 
; COMPUTER READABLE FORM: 

; MEDIUM TYPE: Floppy disk 

; COMPUTER: IBM PC compatible 

OPERATING SYSTEM: PC-DOS/MS-DOS 

SOFTWARE: Patentln Release #1.0, Version #1.30 
CURRENT APPLICATION DATA: 
; APPLICATION NUMBER: US/09/306, 902A 

FILING DATE: 07-May-1999 

CLASSIFICATION: <Unknown> 
ATTORNEY/AGENT INFORMATION: 

NAME: OSMAN, RICHARD A 
; REGISTRATION NUMBER: 36,627 

; REFERENCE/ DOCKET NUMBER: UC96-217 

; TELECOMMUNICATION INFORMATION: 

; TELEPHONE: (415) 343-4341 

TELEFAX: (415) 343-4342 
INFORMATION FOR SEQ ID NO: 1: 
SEQUENCE CHARACTERISTICS: 
; LENGTH: 3014 base pairs 

; TYPE: nucleic acid 

STRANDEDNESS: double 

TOPOLOGY: linear 
MOLECULE TYPE: cDNA 

SEQUENCE DESCRIPTION: SEQ ID NO: 1: 
US-09-306-902A-1 

Query Match 82.1%; Score 2259; DB 3; Length 3014; 

Best Local Similarity 89.7%; Pred. No. 0; 

Matches 2427; Conservative 0; Mismatches 280; Indels 0; Gaps 0; 



Qy 46 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 105 

I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGTGCTCCTGGGCATAGTCCTCGCCGCCTGGCTT 60 

Qy 106 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 165 

M II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II MINIM I I I I I I I I I I I 
Db 61 CGTGGTTCGGGTGCCCAGCAGAGTGCCACGGTGGCCAATCCAGTGCCCGGTGCCAACCCC 120 

Qy 166 GAC CTGCTT CCCCACTT C CTGGT GGAGC CCGAGGAT GT GT AC AT C GT CAAGAACAAGCCA 225 

I I I I I I I I \ I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 GACCT GCT GCC C CACTT C CTGGTAGAGCCT GAGGAC GT GT AC AT T GT CAAGAACAAGC CG 180 

Qy 226 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 285 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 181 GTGTTGTTGGTGTGCAAGGCTGTGCCTGCCACCCAGATCTTCTTCAAGTGCAATGGGGAA 240 

Qy 286 TGGGTGCGCCAGGTGGACCACGTGATCGAGCGCAGCACAGACGGGAGCAGTGGGCTGCCC 345 

I I I I I I I I I I I I I II I I I I I II II I I I I I I I I III I I I I II II I I I I 
Db 241 T GGGT CCGCCAGGTCGAT C ACGT AATT GAAC GCAGC AC C GAC AGCAGCAGCGGATT GCCA 300 

Qy 346 AC CAT GGAGGTCC GCATT AAT GTCT CAAGGC AGC AGGT C GAGAAGGT GTT C GGGCT GGAG 405 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 II II II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 301 ACCATGGAGGT CC GT AT CAACGT AT C GAGGCAGCAGGT AGAGAAAGT GT TT GGGCTGGAG 360 

Qy 406 GAATACT GGT GCCAGTGCGT GGCAT GGAGCT CCT CGGGCACC ACCAAGAGT CAGAAGGCC 465 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 GAATACT GGT GC CAGTGT GT GGCAT GGAGCT CCT CGGGT ACC ACCAAAAGT CAGAAGGCC 420 

Qy 466 T ACATC C GCAT AGCCAGATT GC GCAAGAACTTCGAGCAGGAGCCGCT GGC CAAGGAGGTG 525 

I I I I I I I I II III I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 421 T ACATC C GGATT GCCTATTT GCGCAAGAACTTT GAGCAGGAGCCACT GGC CAAGGAAGTG 480 

Qy 526 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 585 

II I I I I I I I I I I I I I II II II II II II II II II I I I I I I I I I I II I 

Db 481 T CACTGGAGCAAGGC ATT GT ACT AC CTT GT C GC C C C C CAGAAGGAAT CC CC C C AGCT GAG 540 

Qy 586 GT GGAGT GGCT CC GGAAC GAGGAC CT GGT GGAC C C GT C C CT GGAC CCCAAT GT AT ACATC 645 

I I I II I I I I I I II II MINIM I I I II M I Mill M I I I M II I I II I I I 

Db 541 GT GGAGT GGCTT C GAAAT GAGGAC CT CGTGGACC C CTC C CT CGAT CCCAAT GT GT ACATC 600 

Qy 646 ACGCGGGAGCACAGCCT GGT GGT GC GACAGGCCC GC CTT GCT GACACGGCCAACT ACACC 705 

M I I I I II I I I II I I I I II I II II I I I I I II I II I II I II I I I II II I I I I I I I I 
Db 601 ACGCGGGAGCACAGCCT AGTCGTGCGTCAGGCCCGCCTGGCCGACACGGCCAACTACACC 660 

Qy 706 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 765 

II I I I I I I M I II I I M I I M I II I II I I I II I I I I M II II I I I II II 

Db 661 TGTGTGGCCAAGAACATCGTAGCCCGTCGCCGAAGCACCTCTGCAGCGGTCATTGTTTAT 720 

Qy 766 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 825 

I I II I II I II I I I II M I I II I II M I II I I I I II II I I II II I I I I II II I I I I I I I 
Db 721 GTGAACGGTGGGTGGTCGACGTGGACTGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGT 780 

Qy 826 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 885 

I I M II I I II I II I I II I I II I I I II I I II I I I I II I I I II II I I I I II II I I I I II I 

Db 781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCACCTCTCAACGGGGGCGCCTTC 840 

Qy 886 T GT GAGGGGC AGAAT GT C CAGAAAAC AGC CT GCGCC AC C CT GTGCCCAGT AGACGGCAGC 945 

II I II I II I I I II I II I I II II I II I I I II I I I I II I I I I I I I I I I II I M II II I 

Db 841 T GT GAGGGGC AGAAT GT C C AGAAAACAGC CT GCGCC ACT CT GT GC CCAGT GGAT GGGAGC 900 

Qy 946 TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 1005 

II I II I III I I I I III Mil III MM II I I I II III II MM II III II I II I 

Db 901 TGGAGTTCGTGGAGTAAGTGGTCAGCCTGTGGGCTTGACTGCACCCACTGGCGGAGCCGC 960 

Qy 1006 GAGT GCT CT GAC C C AGC ACCCC GCAACGGAGGGGAGGAGT GCCAGGGCACT GACCTGGAC 1065 

I M II II I II II I II I II I I I I II M I II M I I M I II I I I M I I II M I I I I I 

Db 961 GAGTGCTCTGACCCAGCACCCCGCAATGGAGGTGAGGAGTGTCGGGGTGCTGACCTGGAC 1020 

Qy 1066 AC C C GCAACT GT ACCAGT GACCT CT GTGT AC ACAGT GCTT CT GGC CCT GAGGAC GT GGCC 1125 

M I II I M II I I I I II I I M I II II I I I I I I MUM I I I I II I I I II I II I 

Db 1021 ACC CGCAACT GTACCAGT GACCT CTGCCTGCACACC GCT TCTTGCCCC GAGGAC GT GGCT 1080 

Qy 1126 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1185 

Mill I II I I I II I I I II II I I I II II II II I II M I I I I I I 

Db 1081 CTCTACATCGGCCTTGTCGCTGTGGCTGTGTGCCTCTTCTTGCTGTTGCTGGCCCTTGGA 1140 



Qy 1186 CTC GTT T ATT GC C GGAAGAAGGAGGGGCT GGACT C AGAT GT GGCT GACT C GT CCATT CTC 1245 

II I I I II II II II I II II I II I I II I I I I I I II I II I I I I I I I II II II III 



Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 



1141 CT CATTT ACT GT CGCAAGAAGGAAGGGCTGGACT CCGAT GT GGCCGACT C GT C CAT CCT C 1200 

1246 AC CTCAGGCTT CCAGC CC GT CAGCATCAAGC CCAGCAAAGCAGACAACCC CCAT CT GCT C 1305 

I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1201 ACCTCGGGCTT C CAGCCT GT CAGCATCAAGC C CAGCAAAGC AGACAACC CC C AC CT GCT C 1260 

1306 AC CAT CCAGCC GGAC CTC AGC AC C ACCAC CACC ACCT AC CAGGGCAGTCT CT GT CCCCGG 1365 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I III I II 
1261 AC CAT C C AGCCAGACCTCAGCACCAC CACT ACC ACCT AC CAGGGCAGT CTAT GTT C GAGG 1320 

1366 CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 1425 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
1321 C AGGAT GGACC CAGC CCCAAGTT C C AGCT CT CTAAT GGT CAC CTGCT CAGCCC ACT GGGG 1380 

1426 GGCGGC CGC CACA<CACTGCAC CACAGCT CT C C C ACCT CT GAGGCCGAGGAGTT C GT CT CC 1485 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I Mill I I I I I I I I I 
1381 AGT GGCC GC C AT ACGT T GC AC CAC AGCT CACC CACCT CT GAGGCT GAGGACT TC GT CT CC 1440 

1486 CGC CT CTCCAC C CAGAACTACTT C C GCT C CCT GCCC C GAGGCACCAGCAACATGAC CTAT 1545 

I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1441 CGCCTCTCCACCCAA7^CTACTTTCGTTCCCTGCCCCGCGGCACCAGCAACATGGCCTAC 1500 

1546 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1605 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
1501 GGGACCTTCAACTTCCTCGGGGGCCGGCT GAT GAT CCCTAATACGGGGAT CAGCCT C CTC 1560 

1606 AT C CCCC CAGAT GC CAT AC C CCGAGGGAAGAT CTAT GAGAT CT ACCT CAC GCTGCACAAG 1665 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1561 AT ACCCCCGGAT GC CATCCCC CGAGGAAAGAT CT AC GAGAT CT ACCT CACACTGCACAAG 1620 

1666 CCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGC 1725 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
1621 CCAGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCAGTCGTTAGC 1680 

1726 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1785 

I I I I I I I I I I II I I I II II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I 
1681 T GT GGGCC C C CAGGAGT CCT GCT CACC C GGCC AGT CAT C CTT GCAAT GGAC CACT GT GGA 1740 

1786 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1845 

I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I III 
1741 GAGCCCAGCCCTGACAGCTGGAGTCTGCGCCTCAAAAAGCAGTCCTGCGAGGGCAGTTGG 1800 

1846 GAGGAT GTGCT GCAC CTGGGC GAGGAGGC GCCCT CCCACCT CT ACT ACTGC CAGCT GGAG 1905 

I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1801 GAGGAT GT GCT GCACCTT GGT GAGGAGT CACCT T CCCAC CT CTACT ACTGCCAGCT GGAG 1860 

1906 GCCAGTGCCTGCTACGT CTT CAC CGAGCAGCT GGGCC GCTTT GCCCT GGT GGGAGAGGCC 1965 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1861 GCCGGGGCCTGCTATGT CTT CAC GGAGCAGCTGGGCCGCTTT GCCCT GGT AGGAGAGGCC 1920 

1966 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 2025 

I I I I I I I I I I I I I I I I I I I I I I I II I I III I I I I I I I I I I I II I I I I I I I I II 
1921 CTCAGCGTGGCTGCCACCAAGCGCCTCAGGCTCCTTCTGTTTGCTCCCGTGGCCTGTACG 1980 

2026 T C CCT C GAGT ACAACAT C C GGGT CTACT GC CT GC AT GACACCCACGATGCACT CAAGGAG 2085 

I I I I I I I I I I I I I I I I I I I II MINIM II I I I I I I I I I I I II I I I I I I Hi 

1981 T C CCTT GAGT ACAACAT C C GAGT GT ACT GC CT AC AC GACACCCACGACGCT CTCAAGGAG 2040 



Qy 

Db 



2086 GT GGT GCAGCT GGAGAAGCAGCT GGGGGGACAGCT GAT CCAGGAGCCAC GGGT CCTGCAC 2145 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I t I I I I I I I I I I 
2041 GT GGT GCAGCT GGAGAAGCAGCT AGGTGGACAGCT GAT CCAGGAGC CTCGC GT C CT GC AC 2100 



Qy 2146 T T CAAGGACAGTT AC C ACAACCT GC GCCTAT C CAT CC ACGATGT GC C CAGCT CCCT GT GG 2205 

I I I M I I I II I I I I I I I I I I I I II M I I I I I I I I I I I I I I I I I I I I I I I 

Db 2101 TT CAAAGAC AGTT AC CACAAC CT ACGT CT CT CCAT C CACGACGT GC CCAGCTC C CT GT GG 2160 

Qy 2206 AAGAGTAAGCT CCTT GT CAGCT AC CAGGAGATCC C CTTTT ATC ACAT CTGGAAT GGCACG 2265 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 AAGAGCAAGCT ACTT GT CAGCT AC C AGGAGAT C CCTT TTTACCACATCT GGAAC GGCACC 2220 

Qy 2266 CAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTG 2325 

I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I II I I I I I I 
Db 2221 CAGC AGT AT CT GCACT GC ACCTT C ACCCTGGAGCGCAT CAACGC CAGCAC C AGC GAC CT G 2280 

Qy 2326 GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 2385 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 GCCT GCAAGGT GT GGGT GT GGCAGGT GGAGGGAGAT GGGCAGAGCT T CAACAT CAACTT C 2340 

Qy 2386 AAC AT CAC CAAGGACACAAGGTTT GCT GAGCT GCT GGCT CT GGAGAGT GAAGCGGGGGT C 2445 

I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 AACAT CACTAAGGACACAAGGTTT GCT GAAT T GTT GGCTCT GGAGAGT GAAGGGGGGGT C 2400 

Qy 2446 C CAGC CCT GGT GGGC CC CAGT GC CT T CAAGAT CC CCTT CCT CATT CGGCAGAAGATAAT T 2505 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 2401 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAAAAGATCATC 24 60 

Qy 2506 TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 2565 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I II I I I I I I I I I I I I I 
Db 2461 GCCAGTCTGGACCCACCCTGCAGCCGGGGCGCCGACTGGAGAACTCTAGCCCAGAAACTT 2520 

Qy 2566 CACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTC 2625 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2521 CACCT GGACAGC C AT CT T AGCTT CTTT GCCT C CAAGC CCAGCCCT ACAGC CAT GAT CCTC 2580 

Qy 2626 AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 2685 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I I | | | I I I I I I I I I I I I I I I III 

Db 2581 AACCTATGGGAGGCACGGCACTTCCCCAACGGCAACCTCGGCCAGCTGGCAGCAGCTGTG 2640 

Qy 2686 GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGC 2745 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Mill I I I I I 

Db 2641 GCCGGACTGGGCCAACCAGATGCTGGCCTCTTCACGGTGTCGGAGGCCGAGTGTTGAGAC 2700 

Qy 2746 CGGCCAG 2752 

I I I I I I 

Db 2701 CAGCCAG 2707 



RESULT 3 
US-08-808-982-2 

; Sequence 2, Application US/08808982 
; Patent No. 5939271 
; GENERAL INFORMATION: 

; APPLICANT: Tessier-Lavigne, Marc 
APPLICANT: Leonardo, E. David 



APPLICANT: Hink, Lindsay 
APPLICANT: Masu, Masayuki 
APPLICANT: Kazuko, Keino-Masu 
; TITLE OF INVENTION: Netrin Receptors 
; NUMBER OF SEQUENCES: 8 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: SCIENCE & TECHNOLOGY LAW GROUP 
STREET: 268 BUSH STREET, SUITE 3200 
CITY: SAN FRANCISCO 
STATE : CALI FORNIA 
COUNTRY: USA 
ZIP: 94104 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 
COMPUTER: IBM PC compatible 
OPERATING SYSTEM: PC-DOS/MS-DOS 
; SOFTWARE: Patentln Release #1.0, Version #1.30 

; CURRENT APPLICATION DATA: 

; APPLICATION NUMBER: US/08/808,982 

; FILING DATE: 

; CLASSIFICATION: 530 

; ATTORNEY/AGENT INFORMATION: 
; NAME: OSMAN, RICHARD A 

REGISTRATION NUMBER: 36,627 
REFERENCE/ DOCKET NUMBER: UC96-217 
TELECOMMUNICATION INFORMATION: 
TELEPHONE: (415) 343-4341 
TELEFAX: (415) 343-4342 
; INFORMATION FOR SEQ ID NO: 2: 
SEQUENCE CHARACTERISTICS: 
LENGTH: 1787 base pairs 
; TYPE: nucleic acid 

STRANDEDNESS: double 
TOPOLOGY: linear 
MOLECULE TYPE: cDNA 
US-08-808-982-2 



Query Match 56.8%; 
Best Local Similarity 98.5%; 
Matches 1661; Conservative 



Score 1562.4; 
Pred. No. 0; 
0; Mismatches 



DB 2; Length 1787; 



16; Indels 



9; Gaps 



8; 



Qy 1070 GCAACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCT 1129 

I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I II I I II I I I II II I I I I I I I I I I I I 
Db 1 GCAACTGTACCAGTGACCTCTG-GTACACACTGCTTCTGGCCCTGAGGACGTGGCCCTCT 59 



Qy 1130 ATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCG 1189 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 60 ATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCG 119 

Qy 1190 TTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCACCT 1249 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 120 TTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCACCT 179 



Qy 

Db 



1250 
180 



CAGGCTTCCAGCCCGTCAGCATC-AAGCCCAGCAAAGCAGACAACCCCCATCTGCTCACC 
I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
C AGGCTT CCAGC C CGT CAGCAT CTAAGCC CAGCAAAGC AGAC AACC C CCAT CT GCTCAC C 



1308 
239 



Qy 1309 AT CCAGC C GGAC CT CAGCACCAC CACCACCACCT AC C AGGGC AGT CT CTGT CCCCGGCAG 1368 

I I I I I I I I I I I M I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 240 AT CCAGC CGGACCT CAGCACCAC C ACCAC C ACCTACCAGGGCAGT CT CT GT CCCCGGCAG 299 

Qy 1369 GATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGC 1428 

I I I I I I I I I I I I I I I I I II II I II I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I 
Db 300 GATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGC 359 

Qy 1429 GGCCGC CACACACT GCACCACAGCT CTC C C ACCT CT GAGGC C GAGGAGTT CGT CT CC CGC 1488 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I 
Db 360 GGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGC 419 

Qy 1489 CT CT CCACC CAGAACTACTTC C GCT C CCT GCCC C GAGGCACC AGCAAC AT GACCT AT GGG 1548 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 420 CT CT CCAC C CAGAACTACTT CC GCT C CCT GC CCC GAGGCAC C AGCAACAT GAC CT AT GGG 479 

Qy 154 9 ACCTTCAACTT C CT CGGGGGC CGGCT GAT GATC C CTAAT ACAGGT AT CAGC CT CCT CAT C 1608 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 480 ACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGAATCAGCCTCCTCATC 539 

Qy 1609 C C C C CAGAT GCCAT ACCCCGAGGGAAGAT CT AT GAGAT CT AC CT C AC GCT GCACAAGCCG 1668 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 54 0 CC C C CAGAT GCCAT ACCC C GAGGGAAGAT CT AT GAGAT CT AC CT CAC GCT GCACAAGCCG 599 

Qy 1669 GAAGACGT GAGGT T GCC C CT AGCT GGCT GT CAGAC C CT GCT GAGT C C CAT C GT TAGCT GT 1728 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 600 GAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGT 659 

Qy 1729 GGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAG 1788 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 660 GGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAG 719 

Qy 1789 CCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAG 1848 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 720 CCCAGCCCTGACAGCTGGAGCCTGGCCCTCAAAAAGCAGTCGTGCGAGGG-AGCTGGGAG 778 

Qy 1849 GATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCC 1908 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 779 GATGT-CTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCC 837 

Qy 1909 AGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTC 1968 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 838 AGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTC 897 

Qy 1969 AGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCC 2028 

I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 898 AGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCC 957 

Qy 2029 CT C GAGT ACAACAT C CGGGT CT ACT GC CT GCAT GACACCC AC GAT GC ACT CAAGGAGGT G 2088 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 958 CTC GAGT ACAACAT C CGGGT CT ACT GC CT GCAT GACAC CCAC GAT GC ACT CAAGGAGGT G 1017 

Qy 2089 GT GC AGCT GGAGAAGCAGCT GGGGGGAC AGCT GAT C CAGGAGCCAC GGGT C CT GCACTT C 2148 

I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1018 GTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTT- 1076 

Qy 2149 AAGGACAGT T AC CACAAC CT GCGC CT AT C CAT CCAC GAT GT GCCCAGCT C C CT GT GGAAG 2208 



Db 



I I I I I I I I I I I I I I I I I I I I III I I I I I I I II I I II I I I II I I I I I I I I I I I I I 
1077 AAGGACAGTT AC CAC AACCT — GC CCT AT CAT CCAC GAT GT GCCCAGCT C CCTGT GGAAG 1134 



Qy 2209 AGTAAGCT CCTT GT CAGCT ACCAGGAGAT C CCCTT TT AT CACAT CT GGAAT GGCACGCAG 2268 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1135 AGTAAGCT CCTT GT C AG CT AC CAGGAGAT CC C CTTTT AT CACAT CT GGAAT GGCACGCAG 1194 

Qy 2269 CGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCC 2328 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1195 CGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCC 1254 

Qy 2329 T GCAAGCT GT GGGT GT GGCAGGTGGAGGGCGACGGGC AGAGCTT CAGCAT CAACTTCAAC 2388 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1255 T GCAAGCT GT GGGT GTGGCAGGTGGAGGGCGACGGGCAGAGCTT CAGCAT CAACTTCAAC 1314 

Qy 2389 ATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCA 2448 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1315 AT CACCAAGGACACAAGGTTT GCT GAGCT GCT GGCT CT GGAGAGT GAAGC GGGGGTCCCA 1374 

Qy 24 4 9 GCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCC 2508 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1375 GCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCC 1434 

Qy 2509 AGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCAC 2568 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1435 AGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCAC 1494 

Qy 2569 CT GGAC AGC CAT CT CAGCTT CTTTGCCT CCAAGCC CAGCC CCACAGCCAT GAT CCT CAAC 2628 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1495 CT GGACAGCCAT CT CAGCTT CTTT GCCT CCAAGC CCAGCC CCACAGC CAT GAT CCT CAAC 1554 

Qy 2629 CTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCT 2688 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1555 CTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCT 1614 

Qy 2689 GGACTGGGCCAGCCAGACGCTGGCCTC-TTCACAGTG-TCGGAGGCTGAGTGCTGAGGCC 2746 

II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1615 GGGACTGGCCAGCAGGACGGTGGCTTCTTTCACAGTGTTCGGAGGCTGAGTGCTGAGGCC 1674 

Qy 2747 GGCCAG 2752 

I I I I I I 

Db 1675 GGCCAG 1680 
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Query Match 56.8%; Score 1562.4; DB 3; Length 1787; 

Best Local Similarity 98.5%; Pred. No. 0; 

Matches 1661; Conservative 0; Mismatches 16; Indels 9; Gaps 8; 



Qy 


1070 


GCAACTGT AC CAGT GACCT CT GTGT ACACAGT GCTT CT GGC CCT GAGGAC GT GGC C CT CT 


1129 






M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 II 1 




Db 


1 


GCAACTGTACCAGTGACCTCTG-GTACACACTGCTTCTGGCCCTGAGGACGTGGCCCTCT 


59 


Qy 


1130 


ATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCG 


1189 






1 1 1 1 I 1 1 1 1 1 1 1 "l 1 1 1 II 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ! 1 1 1 1 1 




Db 


60 


ATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCG 


119 


Qy 


1190 


TT T ATT GC CGGAAGAAGGAGGGGCT GGACT CAGAT GT GGCT GACT C GT C CATT CT CACCT 


1249 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I I I | I | | | | | | M II 1 1 1 1 




Db 


120 


TTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCACCT 


179 


Qy 


1250 


CAGGCTTCCAGCCCGTCAGCATC-AAGCCCAGCAAAGCAGACAACCCCCATCTGCTCACC 


1308 






1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


180 


CAGGCT T CC AGCC CGT CAGCAT CTAAGC C C AGCAAAGCAGACAACC CCC AT CT GCTCAC C 


239 


Qy 


1309 


AT C CAGC CGGACCT CAGCACC AC C AC CAC CAC CTAC CAGGGCAGT CT CT GT C C CCGGCAG 


1368 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


240 


AT C C AGCC GGACCT CAGCACC AC CAC CAC CACCT AC C AGGGC AGTCT CT GT CCC C GGCAG 


299 


Qy 


1369 


GATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGC 


1428 



Db 



I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

300 GATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGC 359 



Qy 1429 GGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGC 1488 

I I I I I M I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 360 GGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGC 419 

Qy 1489 CTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGG 1548 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 420 CT CTC CAC CCAGAACT ACTT C CGCT CC CTGC CC CGAGGCACC AGCAACAT GACCTAT GGG 479 

Qy 1549 ACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATC 1608 

I I I I I I I I I I I I I I I I I I I I II II I I II I I I I I I I I I I I I I I I I I I I II I II I I I I I I I 
Db 480 ACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGAATCAGCCTCCTCATC 539 

Qy 1609 CCCCCAGATGCCATACCCCGAGGGAAGATCTAT GAGATCTACCT CACGCTGCACAAGCCG 1668 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 540 CC CCCAGAT GC CAT AC C C CGAGGGAAGAT CT AT GAGATCTACCT CAC GCT GC ACAAGCC G 599 

Qy 1669 GAAGACGT GAGGTT GCCC CT AGCT GGCT GT CAGACCCT GCT GAGTC CC AT CGTT AGCT GT 1728 

I I I.I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 600 GAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGT 659 

Qy 1729 GGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAG 1788 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 660 GGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAG 719 

Qy 1789 CCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAG 1848 

M I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 720 CCCAGCCCTGACAGCTGGAGCCTGGCCCTCAAAAAGCAGTCGTGCGAGGG-AGCTGGGAG 778 

Qy 1849 GATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCC 1908 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 779 GATGT-CTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCC 837 

Qy 1909 AGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTC 1968 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 838 AGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTC 897 

Qy 1969 AGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCC 2028 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 898 AGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCC 957 

Qy 2029 CT CGAGT ACAACAT C C GGGT CT ACTGCCT GC AT GAC ACC C AC GATGCACT CAAGGAGGTG 2088 

I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 958 CT CGAGT ACAACAT C C GGGT CT ACT GCCT GCAT GAC ACCC AC GAT GCACT CAAGGAGGTG 1017 

Qy 2089 GTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTTC 214 8 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1018 GTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTT- 1076 

Qy 2149 AAGGACAGTT AC C ACAAC CT GC GCCT AT CCATCC AC GAT GTGCC C AGCT CCCT GT GGAAG 2208 

I I I I I I I I I I I I I I I I I I II III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1077 AAGGACAGTT AC C ACAAC CT — GCCCT AT CATC CAC GAT GT GC C CAGCT C CCT GT GGAAG 1134 

Qy 2209 AGTAAGCT CCT T GT CAGCT AC C AGGAGAT CCCCT TTT AT CAC AT CT GGAAT GGCAC GC AG 2268 

I II I I I I I I I II I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 



1135 AGTAAGCTC CTT GT CAGCT AC C AGGAGAT CCCCTTTTATCACAT CT GGAAT GGCAC GCAG 1194 



CGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCC 2328 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
CGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCC 1254 

TGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAAC 2388 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

T GCAAGCTGT GGGTGT G GCAGGT GGAGGGCGAC GGGCAGAGCTT CAGCAT CAACTT CAAC 1314 

AT CACCAAGGACACAAGGTTT GCT GAGCT GCT GGCT CT GGAGAGT GAAGCGGGGGT CC CA 2448 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ATCACCAAGGAC ACAAGGT T T GCT GAGCT GCT GGCT CT GGAGAGT GAAGC GGGGGT CCCA 1374 

GCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCC 2508 
I M I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
GCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCC 1434 

AGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCAC 2568 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCAC 1494 

CTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAAC 2628 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CT GGACAGCCAT CT CAGCT T CTTTGCCTC CAAGCC CAGC CC CACAGC CAT GAT CCT CAAC 1554 

CTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCT 2688 
I I I I I II I II I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
CTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCT 1614 

GGACTGGGCCAGC CAGAC GCT GGCCT C - T T CAC AGT G- T CGGAGGCT GAGT GCT GAGGC C 2746 
M I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GGGACTGGCCAGCAGGACGGTGGCTTCTTTCACAGTGTT CGGAGGCT GAGT GCT GAGGC C 1674 

GGCCAG 2752 
I I I I I I 

GGCCAG 1680 



-3 
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APPLICANT: Leonardo , E. David 
APPLICANT: Hink, Lindsay 
APPLICANT: Masu, Masayuki 
APPLICANT: Kazuko, Keino-Masu 
TITLE OF INVENTION: Netrin Receptors 
NUMBER OF SEQUENCES: 8 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: SCIENCE & TECHNOLOGY LAW GROUP 

STREET: 268 BUSH STREET, SUITE 3200 

CITY: SAN FRANCISCO 

STATE: CALIFORNIA 

COUNTRY: USA 



Qy 


2269 


Db 


1195 


Qy 


2329 


Db 


1255 


Qy 


2389 


Db 


1315 


Qy 


2449 


Db 


1375 


Qy 


2509 


Db 


1435 


Qy 


2569 


Db 


1495 


Qy 


2629 


Db 


1555 


Qy 


2689 


Db 


1615 


Qy 


2747 


Db 


1675 


RESULT 


5 


US-08- 


808-982- 



ZIP: 94104 
; COMPUTER READABLE FORM: 
; MEDIUM TYPE: Floppy disk 

COMPUTER: IBM PC compatible 

OPERATING SYSTEM: PC-DOS/MS-DOS 

SOFTWARE: Patentln Release #1.0, Version #1.30 
; CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/808 , 982 

FILING DATE: 

CLASSIFICATION: 530 
ATTORNEY/AGENT INFORMATION: 

NAME: OSMAN, RICHARD A 
; REGISTRATION NUMBER: 36,627 

; REFERENCE/ DOCKET NUMBER: UC96-217 

TELECOMMUNICATION INFORMATION: 

TELEPHONE: (415) 343-4341 

TELEFAX: (415) 343-4342 
; INFORMATION FOR SEQ ID NO: 3: 
SEQUENCE CHARACTERISTICS: 

LENGTH: 2831 base pairs 
; TYPE: nucleic acid 

; STRANDEDNESS: double 

TOPOLOGY: linear 
MOLECULE TYPE: cDNA 
US-08-808-982-3 

Query Match 30.6%; Score 841.4; DB 2; Length 2831; 

Best Local Similarity 60.0%; Pred. No. 1.3e-178; 

Matches 1638; Conservative 0; Mismatches 961; Indels 130; Gaps 9; 

Qy 143 ACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATG 202 

Ml IN II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 104 ACTCCTTCCCATCAGCACCCGCGGAGCAGCTGCCTCACTTCCTGCTGGAACCAGAGGATG 163 

Qy 203 T GTACAT CGT CAAGAACAAGCCAGT GCT GCTTGT GT GCAAGGC C GT GC CCGCC AC GCAGA 262 



Db 




2 63 T CTT CTT CAAGT GCAAC GGGGAGT GGGT GCGCCAGGT GGACCACGT GATC GAGCGC AGCA 322 



Db 



224 T CT ACTT CAAGT GTAAT GGC GAGT GGGTT AGCCAGAAAGGC CACGT CAC GCAGGAGAGC C 283 



Qy 



Db 



323 CAGAC GGGAGCAGT GGGCT GCCCAC CAT GGAGGT CC GC ATTAAT GT CT CAAGGCAGC AGG 382 

I I I I II M III I I I I I I I II I I I II I I I I I I I I I 

284 T GGAT GAGGCCAC AGGCTT GC GAAT ACGAGAGGT GCAGAT AGAGGT GT CGCGGCAGCAGG 343 



Qy 



383 TCGAGAAGGTGTTC GGGCT GGAGGAAT ACT GGTGCCAGTGCGTGGCATGGAGCTCCTCGG 442 



Db 



344 TGGAGGAACTTTTTGGGCTCGAGGACTACTGGTGTCAGTGCGTGGCCTGGAGCTCTTCGG 403 



Qy 



Db 



443 GCACCAC CAAGAGT C AGAAGGC CT ACAT CC GCAT AGC CAGATT GC GCAAGAACT T C GAGC 502 

I I I I I I I I I I I I I I I I I I I I I I I I I I II III I I I I I I I I I I I I I I II I 

404 GAACCAC CAAGAGT C GC CGAGCCT ACAT CC GC ATT GC CTACTT GC GCAAGAACTT T GACC 463 



Qy 

Db 



503 
464 



562 
523 



Qy 563 CGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGT 622 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 524 CAGAGGGAGTGCCTGTGGCT GAGGT GGAAT GGCT CAAGAATGAAGAT GT CAT CGAT C C CG 583 

Qy 623 CCCTGGACCCCAATGTATACATCACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCC 682 

I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 584 CT CAGGACACTAACTT C CT GCT CACCAT T GAC CACAACCT CAT CAT C CGCCAGGCGC GCC 643 

Qy 683 TTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCG 742 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 644 TCT CAGACACAGCCAACT ACACCT GT GT GGCAAAGAAT ATT GT GGC CAAGC GC C GGAGCA 703 

Qy 743 CCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCG 802 

I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 704 CGACGGCCACAGTCATCGTCTATGTGAACGGAGGTTGGTCCAGCTGGGCAGAATGGTCAC 763 

Qy 803 TCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGG 862 

I I I I I I I I I II II II I I I I I I I I I I I I III I I I I I I I I I I I I I 

Db 764 CCT GCT CTAACC GCT GC GGCCGAGGTT GGCAGAAACGTACT AGGAC CT GCACCAACCCAG 823 

Qy 863 CGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCA 922 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 824 CCCCACTCAATGGAGGTGCCTTCTGCGAGGGACAGGCTTGCCAGAAGACGGCTTGCACCA 883 

Qy 923 CCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGG 982 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 884 C C GTGT GCC CAGT GGAT GGAGCGT GGACT GAGT GGAGCAAGT GGT C CGCCT GCAGCACAG 943 

Qy 983 ACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGG 1042 

III I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 944 AGTGTGCGCACTGGCGCAGCCGCGAGTGCATGGCACCGCCGCCCCAGAACGGAGGCCGTG 1003 

Qy 1043 AGT GC CAGGGCACT GACCT GGAC AC C C GCAACT GTAC C AGTGACCT CT GT GT AC ACAGT G 1102 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II 

Db 1004 ACTGCAGCGGGACGCTACTTGACTCCAAGAACTGCACCGATGGGCTGTGCGTGCTGAATC 1063 

Qy 1103 CTTCTGGCC CTGAGGACGTGGCCCTCT 1129 

I I I I I I I I I I I II I 

Db 1064 AGAGAACTCTAAACGACCCTAAAAGCCGCCCCCTGGAGCCGTCGGGAGACGTGGCGCTGT 1123 

Qy 1130 ATGTGGGCCTC ATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCC 1186 

I I I I I I I I I I I I I I I I II I I I I III II III I 

Db 1124 ATGCGGGCCTCGTGGTGGCCGTCTTTGTGGTTCTGGCAGTTCTCATGGCTGTAGGAGTGA 1183 

Qy . 1187 TC GTTT ATT GC C GGAAGAAGGAGGGGCT GGACT CAGAT GT GGCT GACT CGT C CAT T C 1243 

I I I I I I I III II I I I I I I I I I I I I I I I II I I 

Db 1184 TC GTGT AC CGGAGAAACT GC C GGGACT T CGACAC GGAC AT C ACT GACT C CT CT GCT GC C C 1243 

Qy 1244 TC ACCT C AGGCTT CCAGC C C GT CAGCAT CAAGCCCAGCAAAGC AGACAACCC C CAT CT GC 1303 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1244 TCACTGGTGGTTTCCACCCCGTCAACTTCAAGACTGCAAGGCCCAGCAACCCACAGCTCC 1303 

Qy 1304 T CAC CAT CCAGC C GGACCT CAGCACCAC CAC CACCAC CT AC CAGGGCAGT CT CT 1357 

I II II MINIMI III I I I I I II I II- III 

Db 1304 TGCACCCATCCGCCCCTCCGGACCTAACGGCCAGTGCTGGCATCTACCGCGGACCTGTGT 1363 



Qy 1358 GTCCCCGGCAGGA TG 1372 

I I I I I I I I I I 

Db 1364 AT GC CCTGCAGGACT CT GCCGACAAGAT C CCT AT GACTAATTC ACCCCTT CT GGATCCCT 1423 

Qy 1373 GGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCC CCTGG 1423 

I I I I I I I I I I I I I I I I I I I I Mill I II I I 

Db 1424 TGCCCAGCCTCAAGATCAAGGTCTATGACTCCAGCACCATCGGCTCTGGGGCTGGCCTGG 1483 

Qy 1424 GTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCT 1483 

I I I I III Ml I I II I I I I I II I I I I 

Db 1484 CTGATGGAGCCGACCTGCTGGGTGTCTTACCACCCGGTACATACCCAGGCGATTTCTCCC 1543 

Qy 1484 CCCGCCTCTCCACCCAGAAC TACTTCCGCTCCC 1516 

I I I I I I II Mill II 

Db 1544 GGGACACCCACTTCCTGCACCTGCGCAGCGCCAGCCTTGGTTCCCAGCACCTCCTGGGCC 1603 

Qy 1517 TGCCCCGAGGCACCAGCAACATGACCTATGGGACCTTCAACTTCCTCGGGGGCCGGCTGA 157 6 

I I I I I I I I I II I II II I I M I I I I I I I I I II I I I I I II I 

Db 1604 TCCCTCGAGACCCCAGCAGCAGTGTCAGTGGCACCTTTGGTTGCCTGGGTGGGAGGCTGA 1663 

Qy 1577 T GAT C C CT AAT ACAGGT AT CAGC CT CCT CAT C C CCC CAGATGCCATAC C CC GAGGGAAGA 1636 

I I I I II I I I II I I I I I I III I I I I II I II I I I I I I 

Db 1664 C CATT C C CGGCACAGGGGT CAGC CT GTT GGT ACCAAAT GGAGCCATT C C CCAGGGCAAGT 1723 

Qy 1637 T CTAT GAGAT CT AC CT CACGCTGC ACAAGCC GGAAGAC GT GAGGTT GCCCCT AGCTGGCT 1696 

I I I I I I I I I I II I I I I I I I II I I I I III 

Db 1724 T CTATGACTTGTAT CTACGTATCAACAAGACTGAAAGCACCCTCCCACTTTCGGAAGGTT 1783 

Qy 1697 GTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGC 1756 

II I I I I II I I I I I I I I I II I I I I I I II I I I I I I I I I I I 

Db 1784 CCCAGACAGTATTGAGCCCCTCGGTGACCTGCGGGCCCACGGGCCTCCTCCTGTGCCGCC 1843 

Qy 1757 CAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCC 1816 

III I II I II II I I II I I I I II M II I II I I I I I I 

Db 1844 CTGTTGTCCTCACTGTGCCCCACTGTGCTGAAGTCATTGCCGGAGACTGGATCTTCCAGC 1903 

Qy 1817 TCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGC 1876 

I I I I I I I I I I I II I II I I I I I II I I I I I III I I I II I I I 

Db 1904 T CAAGACCC AGGC C CAT CAGGGCCACT GGGAGGAGGT GGT GACT TT GGAT GAGGAGACT C 1963 

Qy 1877 CCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGC 1936 

I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I II I II I 

Db 1964 T GAACACCC C CT GCT ACT GC CAGCT AGAGGCTAAAT C CT GCC ACAT CCT GTT GGACCAGC 2023 

Qy 1937 TGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGC 1996 

• - MM II I I I II I II II I I I I I I I I M II II I I I I 

Db 2024 TGGGTACCTACGTGTTCACGGGCGAGTCCTACTCCCGCTCCGCAGTCAAGCGGCTCCAGC 2083 

Qy 1997 TGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAACATCCGGGTCTACTGCC 2056 

I I II I I I I I I I I II I I I I I I I I II I I I I I I II II II II I I 

Db 2084 TAGCCATCTTCGCCCCAGCCCTCTGCACCTCCCTGGAGTATAGTCTCAGGGTCTACTGTC 2143 

Qy 2057 T GCAT GACACCCACGAT GCACTCAAGGAGGT GGT GCAGCT GGAGAAGCAGCT GGGGGGAC 2116 

II I I II I I I I I M II II II I II I I I II I II I II I II II I II 

Db 2144 T GGAGGAC ACT CCT GCAGCACT GAAGGAGGT CCT AGAGCT GGAGAGGACT CT GGGT GGCT 2203 

Qy 2117 AGCT GAT CC AGGAGCCAC GGGTCCT GCACTT CAAGGACAGTT ACCACAACCT GCGCCT AT 2176 



Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2204 ACTTGGT GGAGGAGCCCAAGACT T T GCT CTTTAAGGACAGTT ACCACAAC CT ACG- CT CT 2262 

2177 CCATCCACGATGTGCCCAGCTCCCTGTGGAAGAGTAAGCTCCTTGTCAGCTACCAGGAGA 2236 

1 I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I II II I I I I 

2263 CCCTCCATGACATCCCCCATGCCCACTGGAGGAGCAAACTACTGGCCAAGTACCAGGAGA 2322 

2237 TCCCCTTTTATCACATCTGGAATGGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGG 2296 

I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I 

2323 TTCCCTTCTACCATGTGTGGAACGGCAGCCAGAAAGCCCTGCACTGCACTTTCACCCTGG 2382 



2297 



2356 



AGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGG 
Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2383 AGAGACAT AGC CTAGC CT C C ACT GAGTT C ACCT GTAAGGTCT GCGT GC GGC AGGT AGAAG 2442 

2357 GC GAC GGGCAGAGCT T CAGCATCAACTT CAACAT CAC CAAGGACACAAGGTT T GCT G 2413 

I I I I I I I I I I I I 1 II It II II III I 

2443 GGGAAGGCCAGATTTTCCAGCTGCACACCACGCTGGCTGAGACGCCTGCTGGCTCCCTGG 2502 

2414 AGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCA 2473 
I M I II I III I I I I I I I I I I I I I I I I I I 

ATGCACTCTGCTCTGCCCCTGGCAATGCTGCCACCACACAGCTGGGACCCTATGCCTTCA 2562 



2503 



2533 



2474 AGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGCCTGGACCCACCCTGTAGGCGGG 
M I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

AGATAC CACT GT CCAT C C GCCAGAAGAT CT GCAACAGCCTGGACGC CC C CAACT CACGGG 2622 



2563 



2534 



2623 



2594 



2683 



2654 



GTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAGCCATCTCAGCTTCTTTG 2593 
I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

GCAAT GACT GGC GGCT GTT GGCACAGAAGCT CT C CAT GGACCGGT AC CT GAACT ACTT CG 2682 

CCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCA 2653 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

C C ACCAAAGCT AGT C C C ACAGGC GT GAT CT TAGACCT CTGGGAAGCT C GGCAGCAGGAT G 2742 



ACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCC 2713 
III I I I I I I I I I I I I II III I I I I I I I I II 

2743 AT GGGGACCT CAACAGC CT GGCCAGT GC CTT GGAGGAGAT GGGCAAGAGT GAGAT GCT GG 2802 

2714 TCTTCACAGT GTCGGAGGCTGAGT GCT GA 2742 

I II I I I I I I I I I I I I 

2803 T AGCCAT GAC CACT GAT GGC GATT GCTGA 2831 



RESULT 6 

US-09-306-902A-3 

; Sequence 3, Application US/09306902A 
; Patent No. 6277585 

GENERAL INFORMATION: 
; APPLICANT: Tessier-Lavigne, Marc 

; Leonardo, E. David 

; Hink, Lindsay 

; Masu, Masayuki 

; Kazuko, Keino-Masu 

TITLE OF INVENTION: Netrin Receptors 

NUMBER OF SEQUENCES: 9 

CORRESPONDENCE ADDRESS: 



ADDRESSEE: SCIENCE & TECHNOLOGY LAW GROUP 
; STREET: 268 BUSH STREET, SUITE 3200 

CITY: SAN FRANCISCO 

STATE: CALIFORNIA 

COUNTRY: USA 

ZIP: 94104 
; COMPUTER READABLE FORM: 

; MEDIUM TYPE: Floppy disk 

COMPUTER: IBM PC compatible 

OPERATING SYSTEM: PC-DOS/MS-DOS 

SOFTWARE: Patentln Release #1.0, Version #1.30 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/09/306, 902A 

FILING DATE: 07-May-1999 

CLASSIFICATION: <Unknown> 
ATTORNEY/ AGENT INFORMATION: 

NAME: OSMAN, RICHARD A 

REGISTRATION NUMBER: 36,627 

REFERENCE/ DOCKET NUMBER: UC96-217 
TELECOMMUNICATION INFORMATION: 

TELEPHONE: (415) 343-4341 

TELEFAX: (415) 343-4342 
; INFORMATION FOR SEQ ID NO: 3: 

SEQUENCE CHARACTERISTICS: 
; LENGTH: 2831 base pairs 

; TYPE: nucleic acid 

STRANDEDNESS: double 

TOPOLOGY: linear 
MOLECULE TYPE: cDNA 

SEQUENCE DESCRIPTION: SEQ ID NO: 3: 
US-09-306-902A-3 

Query Match 30.6%; Score 841.4; DB 3; Length 2831; 

Best Local Similarity 60.0%; Pred. No. 1.3e-178; 

Matches 1638; Conservative 0; Mismatches 961; Indels 130; Gaps 9; 



Qy 143 ACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATG 202 

III III II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 104 ACTCCTTCCCATCAGCACCCGCGGAGCAGCTGCCTCACTTCCTGCTGGAACCAGAGGATG 163 

Qy 203 T GTACAT CGT CAAGAACAAGCCAGT GCT GCTTGT GT GCAAGGC C GTGC CCGCCAC GCAGA 262 

I II I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I 

Db 164 C CTACAT CGT AAAGAAC AAGC CAGT GGAATT GC ACT GCC GAGC CT TC C CT GCC AC ACAGA 223 

Qy 263 TCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTGGACCACGTGATCGAGCGCAGCA 322 

I I I I I I I I I I I I I I -I I I I I I I I I I I I I I I I I I I I I I I II III 
Db 224 T CT ACTT CAAGT GTAAT GGC GAGT GGGT T AGCC AGAAAGGC CACGT C ACGCAGGAGAGC C 283 

Qy 323 C AGAC GGGAGC AGT GGGCT GC CCAC CAT GGAGGT C CGCAT TAAT GT CT CAAGGC AGCAGG 382 

I I I I II II I II I I II II I II I I I I I I I I I I I I I I 

Db 284 T GGAT GAGGC CAC AGGCT T GC GAAT ACGAGAGGT GCAGAT AGAGGT GT CGC GGCAGCAGG 343 

Qy 383 TCGAGAAGGTGTTC GGGCT GGAGGAAT ACT GGTGCCAGTGCGTGGCATGGAGCTCCTCGG 442 

I III I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 344 TGGAGGAACTTTTTGGGCTCGAGGACTACTGGTGTCAGTGCGTGGCCTGGAGCTCTTCGG 4 03 

Qy 443 GC AC CAC CAAGAGT CAGAAGGC CTACAT CC GC AT AGC CAGATT GCGCAAGAACTT C GAGC 502 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 



I 1 1 I 1 1 I 1 1 1 1 1 1 I 1 1 1 1 II I I 1 1 ! I II III 1 1 I 1 1 1 I 1 1 1 1 1 1 I II l 

404 GAACCAC CAAGAGT CGCCGAGCCT AC AT CCGCAT T GCCTACTT GCGCAAGAACTTT GAC C 463 

503 AGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCAC 562 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
464 AGGAGC CT CT GGCGAAGGAGGT AC CCTT GGATCAT GAGGT C CTT CT GCAGT GC C GC C CAC 523 

563 CGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGT 622 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
524 C AGAGGGAGT GCCT GT GGCT GAGGT GGAAT GGCT CAAGAAT GAAGAT GT CATC GAT C CCG 583 

623 C CCT GGACCC CAATGT AT ACAT CACGCGGGAGCAC AGC CT GGT GGT GCGACAGGC C CGC C 682 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

584 CTCAGGACACTAACTTCCTGCTCACCATTGACCACAACCTCATCATCCGCCAGGCGCGCC 643 

683 TTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCG 742 

I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

644 T CT C AGACACAGC CAACT AC ACCT GT GT GGCAAAGAAT AT T GT GGC CAAGC GCCGGAGCA 703 

743 CCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCG 802 

I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
704 C GAC GGC CACAGT CAT C GT CT AT GT GAACGGAGGT T GGTCCAGCT GGGCAGAAT GGT CAC 763 

8 03 TCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGG 862 

I I I I I I I I I II II II I I I I I I I I I I I I III I I I I I I I II I I I I 

7 64 C CT GCTCTAAC CGCT GC GGCCGAGGTT GGC AGAAACGT ACT AGGAC CT GCACCAAC C CAG 823 

863 CGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCA 922 

I II I II I I II II 1,1 I I I I I I I I II III I I I I I I I I I I I I I I I I I 
824 CCCCACTCAATGGAGGTGCCTTCTGCGAGGGACAGGCTTGCCAGAAGACGGCTTGCACCA 883 

923 CCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGG 982 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

884 C CGT GT GC CCAGTGGAT GGAGCGT GGACT GAGT GGAGCAAGTGGT CC GCCT GCAGCACAG 943 

983 ACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGG 1042 

III I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I 
944 AGTGTGCGCACTGGCGCAGCCGCGAGTGCATGGCACCGCCGCCCCAGAACGGAGGCCGTG 1003 

1043 AGTGC CAGGGCACT GAC CT GGACAC CC GCAACT GT AC C AGT GAC CT CT GT GT ACAC AGT G 1102 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II 

1004 ACTGCAGCGGGACGCTACTTGACT CCAAGAACT GCACCGAT GGGCTGT GCGTGCT GAATC 1063 

1103 CTTCTGGCC CTGAGGACGTGGCCCTCT 1129 

I I I I I I I I I I I I I I 

1064 AGAGAACTCTAAACGACCCTAAAAGCCGCCCCCTGGAGCCGTCGGGAGACGTGGCGCTGT 1123 

1130 ATGTGGGCCTC ATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCC 1186 

I II I I I I I I I I I I I I I II I I I I III II III I 

1124 ATGCGGGCCTCGTGGTGGCCGTCTTTGTGGTTCTGGCAGTTCTCATGGCTGTAGGAGTGA 1183 

1187 TCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATT C 1243 

I I II I I I III II I I I I I I I I I I I I I I I I I I I 

1184 TCGTGTACCGGAGAAACTGCCGGGACTTCGACACGGACATCACTGACTCCTCTGCTGCCC 1243 

1244 T CAC CTCAGGCT T C CAGC CC GT C AGCAT CAAGCC C AGCAAAGCAGACAAC C C C CAT CT GC 1303 
MM I I II II I II II I II I I I II I I I I I I M II II I I I 
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1244 TCACTGGTGGTTTCCACCCCGTCAACTTCAAGACTGCAAGGCCCAGCAACCCACAGCTCC 1303 

1304 T CACCAT C CAGCCGGAC CTCAGC ACCACCAC CACCACCT ACCAGGGCAGT CTCT 1357 

I II II I I I I I I I I I III I I I I I I I I II III 

1304 TGCACCCATCCGCCCCTCCGGACCTAACGGCCAGTGCTGGCATCTACCGCGGACCTGTGT 1363 



1358 



TG 1372 



GTCCCCGGCAGGA 

I III I I I I I I 

1364 ATGCCCTGCAGGACTCTGCCGACAAGATCCCTATGACTAATTCACCCCTTCTGGATCCCT 1423 

1373 GGCC CAGCC C CAAGTT C C AGCTCACCAAT GGGCAC CT GCTCAGC C C CCTGG 1423 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1424 TGCCCAGCCTCAAGATCAAGGTCTATGACTCCAGCACCATCGGCTCTGGGGCTGGCCTGG 1483 

1424 GT GGCGGC CGCCAC ACACT GCACCACAGCT CT CCCAC CT CT GAGGC CGAGGAGTT CGT CT 1483 

I I I I III III I I Ml I I I I I I I I I I 

1484 CTGATGGAGCCGACCTGCTGGGTGTCTTACCACCCGGTACATACCCAGGCGATTTCTCCC 



1484 CCCGCCTCTCCACCCAGAAC TACTTCCGCTCCC 

I I I I I I I I I I I I I II 

1544 GGGACACCCACTTCCTGCACCTGCGCAGCGCCAGCCTTGGTTCCCAGCACCTCCTGGGCC 

1517 TGCCCCGAGGCACCAGCAACATGACCTATGGGACCTTCAACTTCCTCGGGGGCCGGCTGA 
I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

1604 TCCCTCGAGACCCCAGCAGCAGTGTCAGTGGCACCTTTGGTTGCCTGGGTGGGAGGCTGA 

1577 TGAT CCCTAAT ACAGGT AT CAGCCT CCT CAT C CC C CCAGAT GCCAT AC CCCGAGGGAAGA 

I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I 

1664 CCATTCCCGGCACAGGGGTCAGCCTGTTGGTACCAAATGGAGCCATTCCCCAGGGCAAGT 



1543 



1516 



1603 



1576 



1663 



1636 



1723 



1637 



1696 



TCTAT GAGAT CTACCT CACGCTGCACAAGC C GGAAGAC GTGAGGTT GCCCCT AGCT GGCT 
I I I I I I I I I I I I I I I I I I I I I I I I I III 

1724 TCTATGACTT GTATCTACGTAT CAACAAGACTGAAAGCACCCT CCCACTTTCGGAAGGTT 1783 

1697 GTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGC 1756 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1784 CCCAGACAGTATTGAGCCCCTCGGTGACCTGCGGGCCCACGGGCCTCCTCCTGTGCCGCC 1843 

1757 CAGT CATCCT GGCTATGGAC CACT GTGGGGAGCC C AGCCCT GAC AGCT GGAGCCT GCGCC 1816 

III I I I I I I I I I I I I I I I I II II II I I I I I I I I I 

1844 CT GT TGT C CT CACT GT GCCC CACT GTGCT GAAGT C ATT GCC GGAGACT GGAT CTT CCAGC 1903 

1817 TCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGC 1876 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I II I I I 

1904 T CAAGACC C AGGCCCAT CAGGGC CACT GGGAGGAGGT GGTGACT TT GGAT GAGGAGACT C 



1877 CCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1964 TGAACACCCCCTGCTACTGCCAGCTAGAGGCTAAATCCTGCCACATCCTGTTGGACCAGC 



1937 



1963 



1936 



2023 



1996 



TGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGC 
I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2024 TGGGTACCTACGTGTTCACGGGCGAGTCCTACTCCCGCTCCGCAGTCAAGCGGCTCCAGC 2083 

1997 TGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAACATCCGGGTCTACTGCC 2056 

I I II II II I I I I I I I I I I I I I I I III I II III I Ml III I 

2084 TAGCCATCTTCGCCCCAGCCCTCTGCACCTCCCTGGAGTATAGTCTCAGGGTCTACTGTC 2143 



Qy 2057 TGCAT GACAC CCACGAT GCACTCAAGGAGGT GGTGCAGCTGGAGAAGCAGCT GGGGGGAC 2116 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 2144 TGGAGGACACT CCT GCAGCACTGAAGGAGGT C CT AGAGCTGGAGAGGACT CT GGGT GGCT 2203 

Qy 2117 AGCT GAT CCAGGAGCC AC GGGT C CT GCACTT CAAGGACAGTT AC CACAACCT GCGCCT AT 2176 

I III I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 2204 ACTT GGT GGAGGAGCC CAAGACT T T GCT CTTTAAGGACAGTT ACC ACAACCTACG- CT CT 2262 

Qy 2177 CC AT C CACGAT GT GC C C AGCT C CCT GT GGAAGAGTAAGCT CCTT GT CAGCTACCAGGAGA 2236 

I I I I I I I I I I I I III II I I I I I I I I I I I I I I I II I I I I I I I 

Db 2263 CC CT CC AT GAC AT CC C C CAT GCC C ACT GGAGGAGCAAACT ACTGGCCAAGTACCAGGAGA 2322 

Qy 2237 TCCCCTTTTATCACATCTGGAATGGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGG 2296 

I I I I I I I I I I I I I I II I I I I III I I I I I I I I I I I I I I I I I I I I I 

Db 2323 TTCCCTTCTACCATGTGTGGAACGGCAGCCAGAAAGCCCTGCACTGCACTTTCACCCTGG 2382 

Qy 2297 AGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGG 2356 

Ml I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 2383 AGAGACAT AGC CT AGC CT CCACT GAGTT CACCT GTAAGGT CT GC GT GC GGCAGGTAGAAG 2442 

Qy 2357 GCGACGGGCAGAGCTT C AGC AT CAACT T CAACAT CAC CAAGGACACAAGGTTT GCT G 2413 

I I I I I I I I I I II I II II II II III I 

Db 2443 GGGAAGGCCAGATTTTCCAGCTGCACACCACGCTGGCTGAGACGCCTGCTGGCTCCCTGG 2502 

Qy 2414 AGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCA 2473 

I M I II I III I I I I I I I I I I I II I I I I I 

Db 2503 ATGCACTCTGCTCTGCCCCTGGCAATGCTGCCACCACACAGCTGGGACCCTATGCCTTCA 2562 

Qy 2474 AGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGCCTGGACCCACCCTGTAGGCGGG 2533 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2563 AGAT ACCACT GTCCAT CCGC CAGAAGAT CT GCAACAGCCTGGAC GCCCC CAACTCACGGG 2622 

Qy 2534 GTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAGCCATCTCAGCTTCTTTG 2593 

I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 2623 GCAATGACTGGCGGCTGTTGGCACAGAAGCTCTCCATGGACCGGTACCTGAACTACTTCG 2682 

Qy 2594 CCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCA 2653 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 2683 C CAC CAAAGCT AGT CCC ACAGGC GT GAT CT T AGAC CT CT GGGAAGCT CGGCAGCAGGAT G 2742 

Qy 2654 ACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCC 2713 

III I I I I I I I I I I I I II III I I I I I I I I II 

Db 2743 ATGGGGACCTCAACAGCCTGGCCAGTGCCTTGGAGGAGATGGGCAAGAGTGAGATGCTGG 2802 

Qy 2714 TCTT CAC AGT GTC GGAGGCT GAGT GCT GA 2742 

I II I I I I I I I II I I I 

Db 2803 T AGC CAT GACCACT GAT GGCGAT T GCT GA 2831 



RESULT 7 

US-09-949-016-4794 

; Sequence 4794, Application US/09949016 

; Patent No. 6812339 

; GENERAL INFORMATION : 

; APPLICANT: VENTER, J. Craig et al . 

; TITLE OF INVENTION: POLYMORPHISMS IN KNOWN GENES ASSOCIATED 
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FILE REFERENCE: CL001307 

CURRENT APPLICATION NUMBER: US/09/949,016 
CURRENT FILING DATE: 2000-04-14 
PRIOR APPLICATION NUMBER: 60/241,755 
PRIOR FILING DATE: 2000-10-20 
PRIOR APPLICATION NUMBER: 60/237,768 
PRIOR FILING DATE: 2000-10-03 
PRIOR APPLICATION NUMBER: 60/231,498 
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NUMBER OF SEQ ID NOS : 207012 
SOFTWARE: Fast SEQ for Windows Version 4.0 
SEQ ID NO 4794 
LENGTH: 3008 
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ORGANISM: Human 
US-09-949-016-4794 

Query Match 30.3%; Score 833.6; DB 4; Length 3008; 

Best Local Similarity 62.1%; Pred. No. 7.4e-177; 

Matches 1435; Conservative 0; Mismatches 814; Indels 63; Gaps 5; 

Qy 485 TGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGCATCG 544 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II 
Db 10 T AC GGAAGACATTT GAGC AGGAAC CC CT AGGAAAGGAAGT GT CTTT GGAAC AGGAAGT CT 69 

Qy 545 TGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGGAACG 604 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 70 T ACT CCAGT GT CGACCACCT GAAGGGAT CC CAGT GGCTGAGGT GGAAT GGTT GAAAAAT G 129 

Qy 605 AGGACCT GGT GGAC CCGT CC CT GGACCCCAAT GT ATACAT CAC GC GGGAGC AC AGCCT GG 664 

I I I I I I II I I III I I I I I I I I I I I I I I I I I II 

Db 130 AAGACATAAT T GAT CC C GTT GAAGATC GGAATT TTTATATTACT ATT GAT C ACAACCT CA 189 

Qy 665 T GGT GCGAC AGGC C C GC CT T GCT GACACGGCCAACT ACAC CT GCGT GGCCAAGAAC AT CG 724 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 190 T CAT AAAGCAGGCCC GACT CT CT GAT ACT GCAAATT ACAC CT GT GTT GCCAAAAACATTG 249 

Qy 725 TGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGGTCGA 784 

IN I II I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 250 TT GCCAAGAGGAAAAGT ACAACT GC CACTGT CAT AGT CT AT GT CAACGGT GGCT GGT CCA 309 

Qy 785 CGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGGAGCC 844 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 310 CCT GGACGGAGT GGT CT GT GT GTAACAGCC GCT GT GGACGAGGGT AT CAGAAAC GT ACAA 369 

Qy 845 GGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAATGTCC 904 

Ml II I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I III I 
Db 370 GGACTTGTACCAACCCGGCACCACTCAATGGGGGTGCCTTCTGTGAAGGGCAGAGTGTGC 429 

Qy 905 AGAAAACAGCCTGCGCCACCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGGAGCAAGT 964 

I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 430 AGAAAAT AGC CT GT ACT ACGT TAT GCC CAGT GGAT GGCAGGT GGAC GCCAT GGAGCAAGT 489 

Qy 965 GGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGACCCAGCAC 1024 

I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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490 GGT CTACTT GT GGAACT GAGT GCACCCACT GGCGCAGGAGGGAGT GCAC GGCGCCAGCCC 549 

1025 CCCGCAACGGAGGGGAGGAGT GC CAGGGC ACT GACCT GGACAC CC GCAACT GTACCAGT G 1084 

II I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I II 

550 CCAAGAATGGAGGCAAGGACT GCGAC GGCCTCGT CT T GCAAT CCAAGAACT GCACT GATG 609 

1085 ACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGG CCTCA 1141 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II 
610 GGCTTTGCATGCAGACTGCTCCTGATTCAGATGATGTTGCTCTCTATGTTGGGATTGTGA 669 

1142 TCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGGA 1201 
I I I I I I I I I I I I I I II I I I I I I II I I I I I I I II 

670 TAGCAGTGATCGTTTGCCTGGCGATCTCTGTAGTTGTGGCCTTGTTTGTGTATCGGAAGA 729 

1202 AGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCACCTCAGGCTTCCAGC 1261 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

730 ATCATCGTGACTTTGAGTCAGATATTATTGACTCTTCGGCACTCAATGGGGGCTTTCAGC 789 

1262 C CGT CAGCAT CAAGCC CAGCAAAGCAGACAACCCC CATCT GCT CAC CAT CCAGCC GGACC 1321 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

790 CT GT GAACAT C AAG GCAGCAAGACAAGAT CTGCT GGCTGT ACCC CCAGAC C 840 

1322 T C AGCAC CAC CAC CAC CACCT AC C AGGGC AGT CT CT GT CCC CGGCAGGAT G GGCC 1376 

III I I I III III II I III I III III II I II 

841 T CAC GT C AGCT GCAGC CAT GT ACAGAGGAC CT GT CT AT GCCCT GC ATGAC GT CTCAGACA 900 

1377 CAGCCCCAAGTTCCAGCTCACCAAT GGGCACCTGCTCAGCCCCCTGGGTGGCGGCC 1432 

I I I I I I I I I I I I I I I I I I I II I I I I I I I 

901 AAAT C CCAAT GAC CAACTCTCCAAT TCT GGAT CC ACT GC CCAACCT GAAAAT CAAAGT GT 



1433 



961 



960 



1492 



GCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCT 
I I I I I I I I I I III I I I I I I III III 

ACAACACCT C AGGT GCT GTCACCCC C CAAGAT GACCT CT CT GAGTTTAC GT C CAAGCT GT 1020 



1540 



14 93 C C ACC C AGAACTACT T CC GCT CCCT GC C CCGAGGCACCAGCAAC AT GA 

I I I I I I I I I II I I I I I I I I I 

1021 C C C CTCAGAT GACCCAGT CGTTGTT GGAGAAT GAAGCCCT CAGC CT GAAGAAC CAGAGTC 1080 

1541 CCTATGGGACCTTCAACTTCCTCGGGGGCC 1570 

I I I I I I II I I I I I I I I I I I I I 
1081 T AGCAAGGCAGACT GAT CCAT C CT GTACCGC ATTT GGCAGCTT CAACT CG CT GGGAGGT C 1140 

1571 GGCT GAT GAT CC CTAAT ACAGGT AT CAGCCT C CT CAT C C CC C C AGATGCC AT ACCCCGAG 1630 

I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I II I I I I 
1141 ACCTTATTGTTCCCAATTCAGGAGTCAGCTTGCTGATTCCCGCTGGGGCCATTCCCCAAG 1200 

1631 GGAAGAT CT AT GAGAT CT AC CT CACGCT GCACAAGC C GGAAGACGT GAGGTT GCC CCT AG 1690 

III I I I I I I I I I I III I I I I I I III I I I I I I I I I I 

1201 GGAGAGT CT ACGAAAT GT AT GT GACT GT AC ACAGGAAAGAAACT AT GAGGCCACC CAT GG 1260 

1691 CTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCTGGCGTCCTGCTCA 1750 

II I I I I I I I I I I III II I I I I I I I I I I I I I I II I I I I I I I I II 
1261 ATGACTCTCAGACACTTTTGACCCCTGTGGTGAGCTGTGGGCCCCCAGGAGCTCTGCTCA 1320 



1751 



1810 



CC CGGC CAGT CAT C CT GGCT AT GGAC C ACT GT GGGGAGCCCAGCCCT GACAGCT GGAGC C 

III! I Mil I III I I I I I I I I I I I II I I I I I I I II I I I I I 

1321 CCCGCCCAGTCGTCCTCACTATGCATCACTGCGCAGACCCCAATACCGAGGACTGGAAAA 1380 



Qy 1811 TGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGG 1870 

M I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 1381 T ACTGCT CAAGAACCAGGCAGCAC AGGGACAGTGGGAGGAT GTGGT GGT GGT C GGGGAGG 1440 

Qy 1871 AGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCG 1930 

I III I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 1441 AAAACTT CAC CACC C CCT GCT AC ATT CAGCT GGAT GCAGAGGCCT GCC AC AT CCT C ACAG 1500 

Qy 1931 AGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCC 1990 

I I I I I II II I I I I I I I I I I I I II III II I I I I I I II I I I 
Db 1501 AGAACCTCAGCACCTACGCCCTGGTAGGACATTCCACCACCAAAGCGGCTGCGAAGCGCC 1560 

Qy 1991 TCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAACATCCGGGTCT 2050 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 1561 TCAAGCTGGCCATCTTTGGGCCCCTGTGCTGCTCCTCGCTGGAGTACAGCATCCGAGTCT 1620 

Qy 2051 ACTGCCTGCAT GACACCCACGAT GCACTCAAGGAGGT GGTGCAGCTGGAGAAGCAGCTGG 2110 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 1621 ACT GTCT GGAT GACACCC AGGAT GCCCT GAAGGAAAT T TTAC AT CTTGAGAGACAGAT GG 1680 

Qy 2111 GGGGACAGCT GAT C CAGGAGC CAC GGGT C CT GCACT T CAAGGACAGTT ACCACAACCT GC 2170 

I I I I I I I I I I Mill II I I I I II I I I I I I I I I I I I I I I I I 
Db 1681 GAGGACAGCT CCT AGAAGAAC CTAAGGCTCTT CATT TTAAAG GC AGCACC CACAACCT GC 174 0 

Qy 2171 GCCT AT C CAT CCAC GAT GT GCC CAGCT C C CT GTGGAAGAGTAAGCT CCTT GT CAGCTAC C 2230 

I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I III 
Db 1741 GCCT GTCAAT T CAC GAT AT CGCC CATT C C CT CTGGAAGAGCAAATT GCT GGCTAAAT AT C 1800 

Qy 2231 AGGAGAT CCC CTTTT AT CACAT CT GGAAT GGCAC GCAGC GGT ACTT GCACT GCACCTT CA 2290 

I I I I I I I I I I I I I I I I I I II III III I I I I I I I I I I I I I I I I I I 
Db 1801 AGGAAAT T C CATTTT ACCAT GT T T GGAGT GGATCT CAAAGAAAC CT GCACT GCACCTT CA 1860 

Qy 2291 CCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCTGTGGGTGTGGCAGG 2350 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1861 CTCTGGAAAGATTTAGCCTGAACACAGTGGAGCTGGTTTGCAAACTCTGTGTGCGGCAGG 1920 

Qy 2351 TGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAACATCACCAAGGACACAAGGTTTG 2410 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 1921 T GGAAGGAGAAGGGCAGATCTT CC AGCT CAACT GC AC CGTGT CAGAGGAACCT ACT GGCA 1980 

Qy 2411 CTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGCCCCAGTGCCT 2470 

II I I I I I I I I I II III I I I I I I I I I I I I I I 

Db 1981 TCGATTTGCCGCTGCTGGATCCTGCGAACACCATCACCACGGTCACGGGGCCCAGTGCTT 2040 

.Qy 2471 T CAAGAT CC CCTT C CT CATT C GGC AGAAGATAAT TT C CAGCCT GGACCCACC CTGT AGGC 2530 

III I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 2041 TCAGCATCCCTCTCCCTATCCGGCAGAAGCTCTGTAGCAGCCTGGATGCCCCCCAGACGA 2100 

Qy 2531 GGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAGCCATCTCAGCTTCT 2590 

III I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I II III 

Db 2101 GAGGCCAT GACT GGAGGATGCT GGC CCATAAGCT GAACCTGGACAGGT ACTT GAAT TACT 2160 

Qy 2591 TTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGGGAGGCGCGGCACTTCC 2650 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 TTGCCACCAAATCCAGCCCAACTGGCGTAATCCTGGATCTTTGGGAAGCACAGAACTTCC 2220 



Qy 2651 CCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGGCCAGCCAGACGCTG 2710 

I I I I I I I I I I II I I I I I I I I I III I I I I I I I II II 

Db 2221 CAGATGGAAACCTGAGCATGCTGGCAGCTGTCTTGGAAGAAATGGGAAGACATGAAACGG 2280 

Qy 2711 GCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2742 

III II I I I I III II 
Db 2281 T GGTGT C CTT AGCAGC AGAAGGGCAGT ATTAA 2312 
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FILE REFERENCE: LEX-0244-USA 
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CURRENT FILING DATE: 2001-10-02 
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SEQ ID NO 9 
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ORGANISM: homo sapiens 
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Query Match 17.7%; Score 487; DB 4; Length 2736; 

Best Local Similarity 50.9%; Pred. No. 2.7e-99; 

Matches 1305; Conservative 0; Mismatches 1230; Indels 30; Gaps 5; 

Qy 172 CTTCCCCACTTCCTGGTGGAGCCCGAGGATGTGTACATCGTCAAGAACAAGCCAGTGCTG 231 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 157 CT GCCT CATTT CAT AGAGGAGCCAGAT GAT GCTT AT AT TAT CAAGAGCAAC CCT ATT GCA 216 

Qy 232 CTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTG 291 

II I I I I I I II III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 217 CT CAGGT GCAAAGC GAGGCC AGC CATGCAGAT ATT CT T CAAAT GCAACGGC GAGT GGGT C 276 

Qy 292 CGCC AGGT GGACCAC GT GAT C GAGC GCAGC ACAGAC GGGAGCAGT GGGCT GC C CAC CAT G 351 

I III I I I I I I I II I I I II I I I I II II I 

Db 277 CAT C AGAAC GAGCAC GT CTCT GAAGAGACT CT GGAC GAGAGCT CAGGTT T GAAGGT CC GC .336 

Qy 352 GAGGTC C GCATTAAT GT CTCAAGGCAGCAGGT CGAGAAGGT GT T C GGGCT GGAGGAAT AC 411 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I II 

Db 337 GAAGTGTT CATCAAT GTT ACTAGGCAACAGGT GGAGGACTTCCATGGGCCCGAGGACTAT 396 

Qy 412 TGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCCTACATC 471 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 397 TGGTGCCAGTGTGTGGCGTGGAGCCACCTGGGTACCTCCAAGAGCAGGAAGGCCTCTGTG 456 



Qy 



472 C GCAT AGCC AGATT GC GCAAGAACT TC GAGCAGGAGC C GCTGGCCAAGGAGGT GT C CCT G 
I I I I I I I I I II II II Mill II II II II I I I I I I I I III 



531 



Db 457 CGCAT AGC CT ATTT ACGGAAAAACT TT GAACAAGAC CC ACAAGGAAGGGAAGTT CCCATT 516 

Qy 532 GAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAG 591 

M I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I 

Db 517 GAAGGC AT GATT GT ACT GCACTGC C GCC C AC CAGAGGGAGTCCCT GCTGC CGAGGTGGAA 576 

Qy 592 T GGCT CCGGAACGAGGACCT GGT GGACCCGT CCCT GGAC C CCAAT GT AT ACAT CACGCGG 651 

I I I I I I I I I I I I I I I I I I III II I I I I I I I 

Db 577 T GGCT GAAAAAT GAAGAGCCCATT GACT CT GAACAAGAC GAGAACATTGACACCAGGGCT 636 

Qy 652 GAGCACAGC CTGGT GGT GC GACAGGCCC GC CT T GCT GACACGGC CAACT ACACCTGCGTG 711 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 637 GACCATAAC CT GAT CAT CAGGCAGGCAC GGCT CT C GGACT CAGGAAATTACACCT GCAT G 696 

Qy 712 GCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAAC 771 

M I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 697 GCAGCCAAC AT C GT GGCTAAGAGGAGAAGC CT GT CGGC CACT GT TGT GGT CT AC GTGGAT 756 

Qy 772 GGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGG 831 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 757 GGGAGCTGGGAAGT GT GGAGCGAAT GGT C CGT CT GCAGT C CAGAGT GT GA A 807 

Qy 832 CAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAG 891 

II I I I I I I I I I I I I I II III I I I I I I I I I I I I I I I I 

Db 808 CATT T GCGGATC C GGGAGT GCACAGCAC CAC CC C CGAGAAAT GGGGGCAAATT CT GT GAA 867 

Qy 892 GGGCAGAAT GT C CAGAAAACAGCCT GCGCCAC C CT GTGCCCAGT AGAC GGC AGCT GGAGC 951 

I I I I I I I I I I I I II 

Db 868 GGTCTAAGC C AGGAAT CTGAAAACT GCACAGAT GGT CTTT GCAT CCTAGATAAAAAAC CT 927 

Qy 952 CCGTGGAGCAAGT GGT CGGC CTGTGGGCT GGACT GCACC CACT GGC GGAGC CGT GAGTGC 1011 

I I I I I I I I I I I III 

Db 928 CTT C AT GAAATAAAACC C CAAAGC ATT GAGAAT GCCAGCGACATTGCT TT GT ACT CGGGC 987 

Qy 1012 T CT GAC CCAGCAC C C C GCAACGGAGGGGAGGAGT GC CAGGGCACT GAC CT GGACACCC GC 1071 

II I I I I I I I I II II I I I I I I I I 

Db 988 TTGGGTGCTGCCGTCGTGGCCGTTGCAGTCCTGGTCATTGGTGTCACCCTTTACAGACGG 1047 

Qy 1072 AACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTAT 1131 

II I I I I I I I I I I I I I I I I I I I 

Db 104 8 AGC CAGAGT GACT AT GGC GT GGAC GT CAT T GACT CTT CT GC ATT GACAGGT GGCTTCCA- 1106 

Qy 1132 GTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTT 1191 

I I I I I I I I I I I I I II I I II I I I I I 

Db 1107 — GAC CTT CAACT T CAAAACAGT C C GT CAAGCCAAGAAT ATCAT GGAACTAAT GATACAA 1164 

Qy 1192 T ATT GC CGGAAGAAGGAGGGGCT GGACT CAGAT GT GGCT GACT C GT C CAT T CT C AC CT CA 1251 

I I I I I I I I II I I I I I II 

Db 1165 GAAAAAT C CT TT GGTAACT CCCT GCTC CT GAAT TCT GC CAT GCAGCC AGAT CT GACAGT G 1224 

Qy 1252 GGCTT CCAGC CC GT CAGCAT CAAGCCCAGCAAAGC AGACAAC CC CCAT CT GCT CACCAT C 1311 

M I II II II I I I I I I I I 

Db 1225 AGCCGGACAT ACAGC GGACCCAT CT GT CT GCAGGAC CCT CT GGACAAGGAGCT CAT GACA 1284 

Qy 1312 CAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAGGAT 1371 

III III III I I I I I I II II 

Db 1285 GAGTCCTCACTCTTTAACCCTTTGTCGGACATCAAAGTGAAAGTCCAGAGCTCGTTCATG 1344 



Qy 1372 GGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGC 1431 

III I I I I II Ml II I 

Db 1345 GTTTCCCTGGGAGTGTCTGAGAGAGCTGAGTACCACGGCAAGAATCATTCCAGGACTTTT 1404 

Qy 1432 CGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTC 1491 

I I I I I I I I I I I I III I 

Db 1405 C CCCATGGAAACAACC AC AGCTTT AGT ACAAT GCAT C C CAGAAATAAAAT GCC CT ACAT C 1464 

Qy 1492 T CCACCCAGAACT ACTT CCGCT C C CT GCCC CGAGGCAC CAGCAACAT GAC CTAT GGGACC 1551 

III I I I I I I I I I I I I I I I Ml I 

Db 1465 CAAAATCTGTC AT CACTCC CCACAAGGACAGAACTGAGGACAACT GGT GTC 1515 

Qy 1552 TTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCC 1611 

M I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 1516 TTTGGCCATTTAGGGGGGCGCTTAGTAATGCCAAATACAGGGGTGAGCTTACTCATACCA 1575 

Qy 1612 C CAGAT GCCAT ACC CC GAGGGAAGATCTAT GAGAT CT ACCT C ACGCT GCACAAGCC GGAA 1671 

I I I I I I I I I I I I I I I I I I I I I I I I I Mill 

Db 1576 CACGGTGC CAT CCCAGAGGAGAAT T CTT GGGAGAT T TAT AT GT CCAT CAACCAAGGT 1632 

Qy 1672 GACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGA 1731 

II M II I I I I I I I I I I II I I I I I I I I I I I II I I I I 

Db 1633 GAAC C CAGCCTC C AGT CAGAT GGCT CTGAGGT GCT C CT GAGTCCT GAAGT CACCT GT GGT 1692 

Qy 1732 CCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCC 1791 

I I I I I I I I I I I I I II I II I I I I I I I II I II I 

Db 1693 C CTCCAGACAT GAT C GT CAC CACT C CCTTT GCATT GAC CAT CCC GCACTGT GCAGAT GT C 1752 

Qy 1792 AGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGAT 1851 

M I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I 

Db 1753 AGT T CT GAGCATT GGAAT AT C C ATTTAAAGAAGAGGACACAGCAGGGCAAATGGGAGGAA 1812 

Qy 1852 GTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGT 1911 

I I I I I III II II I III II I I I I II I I I I I II I 

Db 1813 GT GAT GT C AGT GGAAGAT GAAT CT AC AT C CTGTTACTGCCTTTTGGACCCCTTT 1866 

Qy 1912 GCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGC 1971 

I I I I IN II II III I I I I I I I I I I I I I I III 

Db 1867 GC GT GT CAT GT GCT C CT GGACAGCTTT GGGAC CTAT GC GCT CACT GGAGAGCCAAT CACA 1926 

Qy 1972 GTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTC 2031 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 1927 GACTGTGCCGTGAAGCAACTGAAGGTGGCGGTTTTTGGCTGCATGTCCTGTAACTCCCTG 1986 

Qy ... . 2032 GAGT ACAAC AT CC GGGT CT ACT GCCTGC AT GAC ACCCAC GAT GCACT CAAGGAGGT GGTG 2091 

M I I I I I I I I I I I I I I I III I II I I Mill II II II II I 

Db 1987 GATT ACAACTT GAGAGTTT ACT GT GTGGACAAT AC CC CTT GT GCATT T CAGGAAGT GGTT 2046 

Qy 2092 CAGCT GGAGAAGCAGCT GGGGGGAC AGCT GAT C C AGGAGCCAC GGGT C CT GCACT T CAAG 2151 

II I I I I I I I I II I II M I I II I I I I I II I I I I II I 

Db 2047 T CAGAT GAAAGGC AT CAAGGT GGAC AGCT CCT GGAAGAAC CAAAATT GCT GCATTT CAAA 2106 

Qy 2152 GACAGTTACCACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGGAAGAGT 2211 

I II I I III III III I I I I II I I II I II I I II 
Db 2107 GGGAAT AC CT TT AGT CTT CAGAT T T CT GTCCT T GAT AT TC CCCC ATT C CT CT GGAGAATT 2166 



Qy 2212 AAGCT CCTT GT CAGCTACCAGGAGATCCCCTTT T AT CACAT CT GGAAT GGCAC GCAGCGG 2271 

III I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 2167 AAACCATTCACTGCCTGCCAGGAAGTCCCGTTCTCCCGCGTGTGGTGCAGTAACCGGCAG 2226 

Qy 2272 TACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGC 2331 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I 
Db 2227 CCCCTGCACTGTGCCTTCTCCCTGGAGCGTTATACGCCCACTACCACCCAGCTGTCCTGC 2286 

Qy 2332 AAGCT GTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGC AT CAACTTCAACATC 2391 

II III I I I I I I I I I I I I I I I I I I I I I I III 

Db 2287 AAAAT CT GCATT C GGCAGCT CAAAGGCCAT GAACAGAT CCT CCAAGT GCAGACATCAAT C 2346 

Qy 2392 ACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCC 2451 

II II I I I II I I I I II 

Db 2347 CT AGAGAGT GAACGAGAAAC CATCACTT TCTT CGCACAAGAGGACAGCACTTT CC CT GCA 2406 

Qy 2452 CTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGC 2511 

II I I I I I I I I I I I I I I I I I I I I I I III I Ml III III 
Db 2407 C AGACT GGCCCCAAAGC CTTCAAAATT C CCT ACT CC AT CAGACAGCGGATTTGT GCT ACA 2466 

Qy 2512 CTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTG 2571 

III I I I I I II II I I I I I I I I II I I I I II I II 

Db 2467 TTTGATACC CCCAAT GCCAAAGGCAAGGACT GGC AGAT GTT AGCAC AGAAAAACAGCATC 2526 

Qy 2572 GACAGCC AT CT CAGCTT CTTT GC CT C CAAGC CCAGCC C CAC AGCC AT GAT CCT CAAC CTG 2631 

I I I I III I I I I I I I I I I I I III III I I I I I I I 

Db 2527 AACAGGAATTTATCTTATTTCGCTACACAAAGTAGCCCATCTGCTGTCATTTTGAACCTG 2586 

Qy 2632 TGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGA 2691 

I I I II I I I I I I I III I I I I I I I I I II II I 

Db 2587 T GGGAAGCT C GT CAT CAGCAT GAT GGT GAT CT T GACT CCCT GGC CTGT GC C CT T GAAGAG 2646 

j 

Qy 2692 CTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAG 2736 

III I I I I I I I I I I I I I I I I I II 

Db 2647 ATTGGGAGGACACACACGAAACT CTCAAACATTT CAGAATCCCAG 2691 
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Qy 172 CTT C CC CACTT CCT GGTGGAGCCCGAGGAT GT GT ACAT C GT CAAGAACAAGCCAGT GCT G 231 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 271 CTGCCT CATTTCATAGAGGAGCCAGATGATGCTTATATTATCAAGAGCAACCCTATT GCA 330 

Qy 232 CTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTG 291 

II I I I I I I II III I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 331 CT CAGGT GCAAAGC GAGGCCAGC CATGCAGAT ATT CTT CAAAT GCAACGGCGAGTGGGT C 390 

Qy 292 C GCCAGGT GGACCACGT GAT CGAGCGCAGCACAGAC GGGAGCAGT GGGCT GCCCAC CAT G 351 

I I I I I i II I I I II I I I I I I I I I II II I 

Db 391 CAT CAGAAC GAGCACGT CTCT GAAGAGACT CT GGACGAGAGCT CAGGTTT GAAGGT C CGC 450 

Qy 352 GAGGT C C GCATTAATGT CTCAAGGCAGCAGGT CGAGAAGGT GTT C GGGCTGGAGGAAT AC 411 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 451 GAAGTGT T CAT CAAT GTT ACT AGGCAACAGGT GGAGGACTT C CAT GGGCCCGAGGACT AT 510 

Qy 412 T GGT GC C AGT GCGT GGCATGGAGCT CCT CGGGCACCAC CAAGAGT CAGAAGGC CT ACAT C 471 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 511 TGGTGCCAGTGTGTGGCGTGGAGCCACCTGGGTACCTCCAAGAGCAGGAAGGCCTCTGTG 570 

Qy 472 CGCATAGC CAGATT GC GCAAGAACTTC GAGC AGGAGC CGCT GGC CAAGGAGGT GT C C CT G 531 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 571 CGCATAGC CT ATTT AC GGAAAAACTTT GAACAAGAC C CACAAGGAAGGGAAGTT CCCATT 630 

Qy 532 GAGCAGGGCATCGT GCT GCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCC GAGGT GGAG 591 

II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 631 GAAGGC AT GATTGT ACT GCACT GC C GC C CAC C AGAGGGAGT C CCT GCT GCCGAGGT GGAA 690 

Qy 592 TGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATCACGCGG 651 

I I I I I II I I I I I I I I I I I III II I I I I I I I 

Db 691 T GGCTGAAAAATGAAGAGCC CATT GACT CT GAACAAGAC GAGAACATT GACAC CAGGGCT 750 

Qy 652 GAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTG 711 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I 

Db 751 GACCATAACCTGAT CATCAGGCAGGCACGGCTCT CGGACTCAGGAAATTACACCTGCATG 810 

Qy 712 GC CAAGAACAT CGT GG CACGT C GCCGCAGC GC CT C CGCT GCT GTC ATC GT CT AC GT GAAC 771 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 811 GCAGCCAACAT CGT GGCTAAGAGGAGAAGCCT GT CGGC CACT GTT GTGGT CT ACGT GGAT 870 

Qy 772 GGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGG 831 

II I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 871 GGGAGCT GGGAAGT GT GGAGC GAAT GGT CC GT CT GCAGT CC AGAGT GT GA A 921 

Qy 832 CAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAG 891 

M I I I I I I II I I I I I II III I I I I I I I I I I I I I I I I 

Db 922 CATTTGCGGATCCGGGAGTGCACAGCACCACCCCCGAGAAATGGGGGCAAATTCTGTGAA 981 

Qy 892 GGGC AGAAT GT CC AGAAAAC AGC CT GCGCCAC CCT GT GC CC AGT AGACG GCAGCT GGAGC 951 

II I I I I Mil l I I I 

Db 982 GGT CTAAGC CAGGAAT CT GAAAACT GC AC AGAT GGT CTT T GC AT C CT AGATAAAAAAC CT 1041 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
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952 CCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGC 1011 

I I I I I I I I I I I III 
1042 CTT CAT GAAATAAAACCC CAAAGCATT GAGAATGCCAGCGAC ATT GCTTTGT ACT CGGGC 1101 

1012 T CT GAC CCAGCACC C CGCAACGGAGGGGAGGAGT GCCAGGGCACT GAC CTGGACAC CC GC 1071 

II Ml I Mil II II I I I I I I I I 

1102 TTGGGTGCTGCCGTCGTGGCCGTTGCAGTCCTGGTCATTGGTGTCACCCTTTACAGACGG 1161 

1072 AACT GT ACCAGT GACCT CT GT GT AC ACAGT GCTT CTGGC C CT GAGGAC GTGGCCCT CTAT 1131 

II I I I I I I I I I I I I I I I I I I I 

1162 AGCCAGAGT GACTAT GGCGT GGACGT CATT GACT CTT CT GCATTGAC AGGT GGCTT C CA- 1220 



1132 



1191 



GTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTT 
I I I I I I I I I I I I I II I I II I I I I I 

1221 — GACCTTCAACTT CAAAACAGTCCGTCAAGCCAAGAATATCATGGAACTAAT GATACAA 1278 

1192 T ATTGC CGGAAGAAGGAGGGGCT GGACT CAGATGTGGCT GACT CGT CCATT CT CAC CT CA 1251 

I I I I I I I I I I I I I I I I I 

1279 GAAAAATCCTTT GGTAACT C C CT GCT C CT GAATT CT GCCATGC AGC CAGAT CTGACAGT G 1338 

1252 GGCTT CCAGCC CGT C AGCAT CAAGC CCAGC AAAGCAGACAAC C CC CAT CTGCT CACCAT C 1311 

M I I I I I II I I I I I I I I 

1339 AGCCGGACATACAGCGGACCCAT CT GTCTGCAGGACCCTCTGGACAAGGAGCT CATGACA 1398 

1312 CAGCCGGACCT CAGCAC CAC CAC CAC CAC CT ACC AGGGCAGT CT CT GT CC CCGGCAGGAT 1371 

M I III III I I I I I I II II 

1399 GAGT C CT CACT CTT T AAC CCTT T GT C GGAC AT CAAAGT GAAAGT C C AGAGCT C GT TCAT G 1458 



1372 



1459 



1432 



GGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGC 1431 

III I I I I II III II I 

GTTTCC CT GGGAGT GT CT GAGAGAGCT GAGT ACCACGGCAAGAAT CAT T C CAGGACTTTT 1518 



CGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTC 1491 
I I I I I I I I I I I I I I I II I II I I II IN 

1519 CCCCATGGAAACAACCACAGCTTTAGTACAATGCAT CCCAGAAATAAAAT GCCCTACATC 1578 

1492 T C CAC C CAGAACT ACTT C CGCT CCCT GC CCCGAGGC ACCAGCAAC AT GAC CT AT GGGACC 1551 

III I I II II I I I I I I I I I III I 

1579 CAAAAT CT GT C AT CACT CCC CAC AAGGACAGAACT GAGGAC AACT GGT GT C 1629 

1552 TTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCC 1611 

M I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I 

1630 TT T GGC CATTTAGGGGGGCGCTTAGTAAT GC CAAAT ACAGGGGTGAGCTT ACT CAT ACCA 1689 

1612 C CAGAT GCCAT ACC C CGAGGGAAGAT CTAT GAGATCT AC CT CAC GCT GCACAAGC C GGAA 1.67.1 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | 
1690 CACGGT GCCAT CCCAGAGGAGAATT CTT GGGAGATTTATATGTCCAT CAACCAAGGT 1746 

1672 GACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGA 1731 

I I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1747 GAACC CAGC CT C CAGT CAGAT GGCT CT GAGGT GCTCCTGAGT C CT GAAGT C ACCT GT GGT 1806 

1732 CCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCC 1791 

I I I I I I I I I I I I I II I I I I II I I I I I I I II I 

1807 CCT CCAGACAT GAT CGT CAC CACT CCCTTTGCATTGACCATCCCGCACTGTGCAGATGTC 1866 



Qy 1792 AGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGAT 1851 

II I I I I I I I I M I I I I I I II I I I I I I I i I I I I I I 

Db 1867 AGT T CT GAGC ATT GGAAT AT CC AT TT AAAGAAGAGGAC AC AGCAGGGCAAAT GGGAGGAA 1926 

Qy 1852 GTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGT 1911 

I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I 

Db 1927 GTGATGTCAGTGGAAGATGAAT CTACATC CTGTTACTGCCTTTTGGACCCCTTT 1980 

Qy 1912 GCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGC 1971 

I I I I III II II III I I I I I I I I I I I I I I I II 

Db 1981 GCGT GT CAT GTGCT C CT GGACAGCTTT GGGAC CT AT GC GCT C ACT GGAGAGCCAAT CACA 2040 

Qy 1972 GTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTC 2031 

I. I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2041 GACTGTGCCGTGAAGCAACTGAAGGTGGCGGTTTTTGGCTGCATGTCCTGTAACTCCCTG 2100 

Qy 2032 GAGT ACAACAT C C GGGTCT ACT GCCT GC AT GAC AC CCACGAT GCACT CAAGGAGGT GGT G 2091 

MINIMI I I I M I I I III I I II I I I I I I I I I I I I I II 

Db 2101 GATT ACAACTT GAGAGTT T ACT GT GT GGACAAT AC C CCTT GT GCATTT CAGGAAGT GGTT 2160 

Qy 2092 CAGCTGGAGAAGCAGCT GGGGGGAC AGCT GAT CCAGGAGCCACGGGT C CT GC ACTT CAAG 2151 

I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I 

Db 2161 TCAGATGAAAGGCAT CAAGGTGGACAGCTCCTGGAAGAACCAAAATTGCT GCATTTCAAA 2220 

Qy 2152 GAC AGT T AC CACAAC CTGCGCCT AT C CAT CCACGAT GT GCC CAGCT CC CT GTGGAAGAGT 2211 

I II I I III III III I I I I I I I I I I I I I I I II 

Db 2221 GGGAATACCTTTAGTCTTCAGATTTCTGTCCTTGATATTCCCCCATTCCTCTGGAGAATT 2280 

Qy 2212 AAGCT C CTT GT CAGCT AC CAGGAGAT C C CCT TTTAT CACAT CTGGAAT GGC ACGCAGC GG 2271 

III I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 2281 AAACCATTCACTGCCTGCCAGGAAGTCCCGTTCTCCCGCGTGTGGTGCAGTAACCGGCAG 2340 

Qy 2272 T ACT TGCACT GC ACCT TC ACCCT GGAGC GT GT CAGC CC CAGC ACT AGT GAC CT GGCCT GC 2331 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I 
Db 2341 CCCCTGCACTGTGCCTTCTCCCTGGAGCGTTATACGCCCACTACCACCCAGCTGTCCTGC 2400 

Qy 2332 AAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAACATC 2391 

II III I I I I I I I I I I I I I I I I I I I I I I III 

Db 2401 AAAAT CT GCATT CGGCAGCT CAAAGGC CAT GAAC AGAT CCT C CAAGT GCAGAC AT CAATC 2460 

Qy 2392 ACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCC 2451 

II II I I I II I I I I I I 

Db 2461 CT AGAGAGT GAAC GAGAAAC CAT C ACT TT CTT CGCACAAGAGGACAGCACTTT C C CT GCA 2520 

Qy 2452 CTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGC 2511 

II I I I I I I I I I I I I I I I I I I I I I I III I III III III 
Db 2521 CAGACT GGCC C CAAAGCCT T CAAAATT C CCT ACT C CAT CAGACAGCGGATTT GT GCT ACA 2580 

Qy 2512 CTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTG 2571 

I I I I I I I I II I I I I I I I I I I I I I I I II I I II 

Db 2581 TTT GATACCCCCAAT GCCAAAGGCAAGGACTGGCAGAT GTTAGCACAGAAAAACAGCATC 2640 

Qy 2572 GAC AGC CAT CTCAGCT TCTTT GCCT C CAAGC C CAGC C C CACAGC CAT GAT CCT CAAC CT G 2631 

I II I III I I I II I I I I I I I III III I I I I I I I 

Db 2641 AAC AGGAAT T TAT CT TAT T T C GCT AC ACAAAGTAGC C CAT CT GCT GT CATTTT GAAC CT G 2700 

Qy 2632 TGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGA 2691 



1 1 1 1 1 1 1 1 1 1 1 I III III I 1 1 1 1 1 II II I 

Db 2701 T GGGAAGCT C GT CAT CAGCAT GAT GGT GAT CTT GACT CCCT GGC CT GT GC CCT T GAAGAG 2760 

Qy 2692 CT GGGCCAGC CAGACGCT GGCCT CTTCACAGT GT C GGAGGCT GAG 2736 

III I I I I I I I I I I I I I I I I I I I 

Db 2761 ATT GGGAGGACAC ACAC GAAACT CT CAAACATTT CAGAAT CCCAG 2805 



RESULT 10 
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Qy 172 CTTCCCC ACTT CCT GGT GGAGCCC GAGGAT GT GT ACAT CGT CAAGAACAAGCCAGTGCT G 231 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I. I I 

Db 157 CT GCCT C ATTT CAT AGAGGAGCCAGAT GAT GCTT AT ATT AT CAAGAGCAAC CCTATT GCA 216 

Qy 232 CTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTG 291 

II I I I I I I II III I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 217 CT CAGGT GCAAAGCGAGGCCAGC CAT GCAGATATT CTT CAAAT GCAAC GGCGAGT GGGTC 276 

Qy 292 C GCCAGGT GGACCACGT GAT CGAGC GCAGCACAGACGGGAGCAGT GGGCTGCCC AC CAT G 351 

I III I I I I I I I II I I I I I I I I I II II I 

Db 277 C ATCAGAACGAGCAC GT CTCT GAAGAGACT CT GGACGAGAGCT CAGGTTT GAAGGT CCGC 336 

Qy 352 GAGGT CC GC ATT AAT GT CTCAAGGC AGCAGGT C GAGAAGGT GTT C GGGCT GGAGGAAT AC 411 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 337 GAAGT GT T CAT CAAT GTT ACT AGGCAACAGGT GGAGGACTT CCAT GGGCCC GAGGACT AT 396 

Qy 412 TGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCCTACATC 471 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I MINIM I 

Db 397 TGGTGCCAGTGTGTGGCGTGGAGCCACCTGGGTACCTCCAAGAGCAGGAAGGCCTCTGTG 456 

Qy 472 CGCATAGCCAGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTG 531 

I I Ml I I I I II II II Mill II II II I III I I II I I III 
Db 457 CGCAT AGCCT ATTT ACGGAAAAACTTT GAACAAGAC C C ACAAGGAAGGGAAGTT CC C ATT 516 



Qy 532 GAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAG 591 

M I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 517 GAAGGCATGATTGT ACT GC ACTGCC GCCCAC CAGAGGGAGT CCCT GCT GCCGAGGT GGAA 576 

Qy 592 TGGCT C CGGAACGAGGAC CT GGT GGAC CCGT CCCT GGAC CC CAAT GT AT ACAT CACGCGG 651 

I I I I I I I I I I I I I I I I I I III II I I I I I I I 

Db 577 T GGCT GAAAAAT GAAGAGC CCAT T GACTCT GAACAAGAC GAGAAC ATT GACACCAGGGCT 636 

Qy 652 GAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTG 711 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 637 GACC ATAACCT GAT CAT CAGGCAGGCACGGCT CT C GGACTCAGGAAATT ACAC CT GCAT G 696 

Qy 712 GC CAAGAACAT C GT GGCACGT C GCC GCAGC GC CT CCGCT GCT GT C AT CGT CT ACGT GAAC 771 

M II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 697 GCAGCCAACATCGTGGCTAAGAGGAGAAGCCTGTCGGCCACTGTTGTGGTCTACGTGGAT 756 

Qy 772 GGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGG 831 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 757 GGGAGCT GGGAAGT GT GGAGCGAAT GGT CC GT CT GCAGT CCAGAGT GT G AA 807 

Qy 832 CAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAG 891 

II I I I I I I I I I I I I I II III I I I I I I I I I I I I I I II 

Db 808 CAT T TGC GGAT CCGGGAGTGCACAGCAC CACC CC CGAGAAAT GGGGGCAAATT CT GTGAA 867 

Qy 892 GGGCAGAAT GT C CAGAAAACAGCCT GC GC CACCCT GT GC CCAGT AGACGGC AGCT GGAGC 951 

I I I I I I I I I I I I I I I I II 

Db 868 GGT CTAAGC CAGGAAT CT GAAAACT GCACAGATGGTCTTTGC AT C CT AGGCATTGAGAAT 927 

Qy 952 CCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGC 1011 

I I I I I I I I I I I I I I I I I 

Db 928 GCCAGCGACATTGCTTTGTACTCGGGCTTGG GTGC 962 

Qy 1012 TCTGACCCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTGGACACCCGC 1071 

I III III III I I I I I I III 
Db 963 TGCCGTCGTGGCCGTTGCAGTCCTGGTCATTGGTGTCACCCTTTACAGACGGA 1015 

Qy 1072 AACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTAT 1131 

I I I I I I I I I I I I I III I II 

Db 1016 GCC AGAGT GACT AT GGC GT GGACGT CATTGACT CTT CT GCAT TGACAGGTGGCTT C 1071 

Qy 1132 GTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTT 1191 

I I I I I I I I I I I I I II I I II I I I I I 

Db 1072 C AGACCTT CAACTT CAAAACAGT C CGT CAAGC CAAGAAT AT C AT GGAACTAAT GAT ACAA 1131 

Qy 1192 TATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCACCTCA 1251 

I I I I I I I I I I I I I I I I I 

Db 1132 GAAAAAT C CT T T GGTAACT C C CT GCTC CT GAATT CT GC CAT GCAGCCAGAT CT GAC AGT G 1191 

Qy 1252 GGCTT C C AGC C CGT C AGCAT CAAGC CCAGCAAAGCAGACAAC CC C CAT CT GCT CACCAT C 1311 

M I I I I I II I I I I I I I I 

Db 1192 AGCCGGACATACAGCGGACCCATCT GT CTGCAGGACCCTCTGGACAAGGAGCTCATGACA 1251 

Qy 1312 CAGC CGGACCT CAGC ACCAC CAC CACCACCT ACC AGGGCAGT CT CT GT CC CC GGCAGGAT 1371 

III III III I I I I I I II II 

Db 1252 GAGT CCT C ACT CT TT AAC CCTTT GT CGGAC AT CAAAGT GAAAGT C C AGAGCT CGTT C AT G 1311 



Qy 1372 GGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGC 1431 

III II II I I III II I 

Db 1312 GTTT CCCT GGGAGT GT CTGAGAGAGCT GAGTACCACGGCAAGAAT CATTCCAGGACTTTT 1371 

Qy 1432 C GCCACACACT GC ACCACAGCT CT CCCACCTCT GAGGCCGAGGAGTT C GT CTC C C GCCTC 1491 

I Ml I I I I I I I I I I I II III I I I I I I I 

Db 1372 C CCCATGGAAACAACCAC AGCT TT AGTACAAT GCAT C C C AGAAATAAAAT GCCCT ACAT C 1431 

Qy 1492 T CCACCC AGAACT ACTT C CGCT CCCT GC CC C GAGGCACCAGCAACAT GAC CTAT GGGACC 1551 

III I I I I I I I I I I I I I I I III I 

Db 1432 CAAAATCTGTC AT CACTC CCCACAAGGACAGAACT GAGGACAACTGGTGT C 1482 

Qy 1552 TTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCC 1611 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1483 TTTGGCCAT T T AGGGGGGCGCTT AGTAATGC CAAATACAGGGGT GAGCTTACT CAT AC CA 1542 

Qy 1612 CCAGATGC C AT ACC CCGAGGGAAGATCT AT GAGAT CT ACCT C AC GCT GCAC AAGC CGGAA 1671 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1543 CACGGTGC C AT CC CAGAGGAGAAT T CTT GGGAGATTT AT AT GT CCAT CAACCAAGGT 1599 

Qy 1672 GACGT GAGGT T GCCCCT AGCT GGCT GT CAGACC CT GCT GAGTC CCAT CGTT AGCT GTGGA 1731 

II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1600 GAAC CCAGCCT CCAGTCAGAT GGCT CT GAGGT GCT CCT GAGT CCT GAAGT CACCT GT GGT 1659 

Qy 1732 CCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCC 1791 

I I I I I I I I II I I I II I I I I I I I I I I I 

Db 1660 CCTC C AGACATGAT CGT CAC CACT C CCT TT GC ATT GAC CAT C CC GCACTGT GCAGAT GTC 1719 

Qy 1792 AGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGAT 1851 

II I II I I I I I II I I I I I I II I I I I I I I I I I I I I I 

Db 1720 AGTT CT GAGCATT GGAAT AT CCAT T TAAAGAAGAG G ACACAGC AGGGCAAAT GGGAGGAA 1779 

Qy 1852 GTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGT 1911 

I I I I I III II II I III II I I I I I I I I I I I II I 

Db 1780 GT GAT GT C AGT GGAAGAT GAAT CT ACAT C CTGTTACTGCCTTTTGGACCCCTTT 1833 

Qy 1912 GCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGC 1971 

I I I I III II II III I I I I I I I I I I I I I I III 

Db 1834 GC GT GTC AT GT GCT C CT GGACAGCTTT GGGACCT AT GC GCT CACT GGAGAGCCAAT CACA 1893 

Qy 1972 GTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTC 2031 

I M I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1894 GACTGTGCCGTGAAGCAACTGAAGGTGGCGGTTTTTGGCTGCATGTCCTGTAACTCCCTG 1953 

Qy 2032 GAGTACAACAT CCGGGTCTACTGCCTGCAT GACACCCACGAT GCACT CAAGGAGGTGGTG 2091 

I I I I I I I I I I I I I I I I I III I I I I I Mill I I M II II I 

Db 1954 GATT ACAACTT GAGAGT TT ACT GT GTGGACAAT AC CC CT T GT GC ATT T CAGGAAGT GGTT 2013 

Qy 2092 CAGCT GGAGAAGC AGCT GGGGGGAC AGCTGAT C CAGGAGC CAC GGGT CCT GCACT T CAAG 2151 

II I II I I I I M M II II I I II II I I II I I I II I I I 

Db 2014 T CAGATGAAAGGC AT CAAGGT GGAC AGCT C CT GGAAGAAC CAAAATT GCT GCATT T CAAA 2073 

Qy 2152 GACAGTT AC CACAAC CT GCGC CTAT C CAT CCAC GATGT GC C CAGCT CCCT GT GGAAGAGT 2211 

I II I I III III III I I I I M I I II I II I I II 
Db 2074 GGGAAT AC CTTT AGT CT T CAGAT T T CT GTC CTT GAT ATT C C CC CAT T CCT CT GGAGAATT 2133 

Qy 2212 AAGCT C CT T GT CAGCTACCAGGAGATCCC CTTT TAT C ACAT CT GGAAT GGCACGCAGC GG 2271 



Ill I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I 1 1 1 II I 1 1 I 

Db 2134 AAACCATTCACTGCCTGCCAGGAAGTCCCGTTCTCCCGCGTGTGGTGCAGTAACCGGCAG 2193 

Qy 2272 T ACTT GCACT GCAC CTT CAC C CT GGAGC GT GT CAGCC C CAGCACT AGT GAC CT GGCCT GC 2331 

I M I I I I I I I I I I I I II I I I I I I I I I I I I III I I I I I I I I I 
Db 2194 CCCCTGCACTGTGCCTTCTCCCTGGAGCGTTATACGCCCACTACCACCCAGCTGTCCTGC 2253 

Qy 2332 AAGCTGT GGGT GT GGCAGGT GGAGGGC GAC GGGC AGAGCTT CAGCATCAACTT CAACAT C 2391 

II III I Mill I I I I I I I I I I I I II I I III 

Db 2254 AAAATCT GC ATTC GGC AGCT CAAAGGC C AT GAACAGAT C CT CCAAGTGCAGAC ATCAAT C 2313 

Qy 2392 AC CAAGGACACAAGGTTT GCT GAGCT GCTGGCT CT GGAGAGT GAAGCGGGGGT CCCAGC C 2451 

II II I I I II I I I I I I 

Db 2314 CTAGAGAGT GAACGAGAAAC CAT C ACTTTCTT CGCACAAGAGGACAGC ACTTT CC CT GCA 2373 

Qy 2452 CTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGC 2511 

II I I I I I I I I I I I I I I I I I I I I I I III I I I I III III 
Db 2374 CAGACT GGC CCCAAAGC CTT CAAAATT C CCTACT C CAT C AGACAGCGGATTT GTGCTACA 2433 

Qy 2512 CTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTG 2571 

III I I I I I II I I I I I I I I I I I I I I I I I I I II 

Db 2434 TTT GAT ACC C C CAAT GC CAAAGGCAAGGACTGGCAGAT GTT AGCACAGAAAAACAGCAT C 2493 

Qy 2572 GACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTG 2631 

I I I I III I I I I I I I I I I I I III III I I I I I I I 

Db 2494 AACAGGAATTT AT CTT AT TT CGCT ACACAAAGTAGC C CATCT GCT GTC ATTTT GAACCT G 2553 

Qy 2632 TGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGA 2691 

I I I I I I I I I I I I III III I INN II II I 

Db 2554 TGGGAAGCT CGTCAT CAGC AT GAT GGT GAT CT T GACT C C CT GGC CT GT GC C CTTGAAGAG 2613 

Qy 2692 CT GGGC CAGC CAGACGCT GGC CT CTTCAC AGT GT C GGAGGCT GAG 2736 

III I I I II I I I I I I I II II I II 

Db 2614 ATT GGGAGGAC ACACAC GAAACT CT CAAACAT TT CAGAATC CC AG 2658 



RESULT 11 
US-09-969-532-13 

; Sequence 13, Application US/09969532 

; Patent No. 6777232 

; GENERAL INFORMATION: 

; APPLICANT: Walke, D. Wade 

; APPLICANT: Scoville, John 

; TITLE OF INVENTION: No. 6777232el Human Membrane Proteins and Polynucleotides 
Encoding the Same 

; FILE REFERENCE: LEX-0244-USA 

; CURRENT APPLICATION NUMBER: US/09/969, 532 

; CURRENT FILING DATE: 2001-10-02 

; PRIOR APPLICATION NUMBER: US 60/237,280 

; PRIOR FILING DATE: 2000-10-02 

; NUMBER OF SEQ ID NOS : 33 

; SOFTWARE: FastSEQ for Windows Version 4.0 
; SEQ ID NO 13 

LENGTH: 2694 

TYPE: DNA 
; ORGANISM: homo sapiens 
US-09-969-532-13 



Query Match 16.7%; Score 460.2; DB 4; Length 2694; 

Best Local Similarity 51.9%; Pred. No. 2.7e-93; 

Matches 1330; Conservative 0; Mismatches 1163; Indels 72; Gaps 10; 



Qy 172 CTT CCCCACTT C CT GGT GGAGCCCGAGGAT GT GTACAT CGT CAAGAACAAGC CAGT GCT G 231 

I I I I I I I I I I I I I I I I I I I I I I I I | | | I I I I I I I I I I I I 

Db 157 CT GCCT CATTT CAT AGAGGAGC CAGAT GAT GCTTATATT AT CAAGAGCAACC CT ATT GCA 216 

Qy 232 CTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTG 291 

II I I I I I I II III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 217 CT CAGGTGCAAAGC GAGGCCAGCCATGC AGAT ATT CTT CAAAT GCAACGGCGAGT GGGT C 276 

Qy 292 C GCCAGGT GGACC AC GT GAT C GAGC GCAGC ACAGAC GGGAGCAGT GGGCT GC CCAC CATG 351 

I III I I I I I I I II I I I I I I I I I II II I 

Db 277 CAT C AGAAC G AGC ACGT CT CT GAAGAGACT C T GG AC GAGAG CT C AGGT TT GAAGGT C C GC 336 

Qy 352 GAGGT CCGCAT TAAT GT CTCAAGGCAGCAGGT CGAGAAGGT GT T C GGGCT GGAGGAAT AC 411 

I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I II I II 

Db 337 GAAGTGTTCAT CAAT GTT ACT AGGCAACAGGT GGAGGACTT CCAT GGGCC CGAGGACT AT 396 

Qy 412 TGGT GC CAGT GCGT GGCATGGAGCT CCT CGGGCAC CACCAAGAGT CAGAAGGC CT ACAT C 471 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 397 TGGTGCCAGTGTGTGGCGTGGAGCCACCTGGGTACCTCCAAGAGCAGGAAGGCCTCTGTG 456 

Qy 472 CGCATAGCCAGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTG 531 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 457 CGC ATAGCCT ATTT AC GGAAAAACTTT GAACAAGAC C CACAAGGAAGGGAAGTT CCCATT 516 

Qy 532 GAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAG 591 

M M M I I M I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 517 GAAGGCATGATTGTACTGCACTGCCGCCCACCAGAGGGAGTCCCTGCTGCCGAGGTGGAA 576 

Qy 592 TGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATCACGCGG 651 

I I I I I I I I I I I I I I I I I I III II I I I I I I I 

Db 577 TGGCTGAAAAATGAAGAGC CCAT T GACT CT GAACAAGAC GAGAACATT GACACCAGGGCT 636 

Qy 652 GAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTG 711 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 637 GAC CATAACCT GAT CAT C AGGC AGGCACGGCT CT CGGACTCAGGAAAT T AC AC CT GCAT G 696 

Qy 712 GCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAAC 771 

II I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I 

Db 697 GCAGCCAACATCGTGGCTAAGAGGAGAAGCCTGTCGGCCACTGTTGTGGTCTACGTGGAT 756 

Qy 772 GGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGG 831. 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 757 GGGAGCT GGGAAGT GT GGAGC GAAT GGT CCGT CT GCAGT CCAGAGT GT G AA 807 

Qy 832 CAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAG 891 

II I I I I I I I I II I I I II III I I I I I I I I I II I I I II 

Db 808 CATTTGC GGAT CCGGGAGT GCAC AGCAC CACCCC C GAGAAAT GGGGGCAAATT CT GT GAA 867 

Qy 892 GGGC AGAAT GT CCAGAAAACAGC CT GC GC CACCCT GT GC CCAGTAGAC GGCAGCT GGAGC 951 

III I I I I I I II III III I II 

Db 868 GGTC — TAAGC CAGGAAT CT GAAAACT GCACAGAT GGT CTTT GCAT CCT AGAT AAAAAAC 925 
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952 CCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGC 1011 

I I I I I I II I II I III I II I 

926 CTCTT CAT GAAATAAAACCC CAAAGCAT T GAG AAT GCCAGCGACATT GCTTT GTAC 981 

1012 T CT GACC CAGCACCC C GCAACGGAGGGGAGGAGTGCCAGGGC ACT GACCT GGAC AC CCGC 1071 

II I I I I I I I I I I I I I I I I I I I II 

982 TCGGGCTTGGGTGCTGCCGTCGTGGCCGTTGCAGTCCTGGTCATTGGTGT CACC 1035 

1072 AACT GTAC CAGT GAC CTCT GT GT ACACAGTGCT TCT GGCCCT GAGGACGT GGCCCT CTAT 1131 

II I II III III I I I I I III 

1036 CTTT ACAGACGGAGCCAGAGT GACT AT GGCGT GGACGTC ATT GACT CTT CT GCATT GACA 1095 

1132 GTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTT 1191 

I I I I I I III III I I I I I I I I I I I I I 

1096 GGT GGCTT C CAGACCTT CAACTT CAAAAC AGT C C GT CAAGGTAACT C C CT GCT CCT GAAT 1155 

1192 TAT T GCC GGAAGAAGGAGGGGCT GGACT CAGAT GT GGCT GACT CGT C CATT CT CAC CT CA 1251 

I I I I I I I I I I I I III I I I I I 

1156 T CT GC CAT GCA GCCAGATCT GACAGT GAGCC GGACAT AC AGC GGACCCAT CT 1207 

1252 GGCTT CCAGCC C GTCAGCAT CAAGC CC AGCAAAGCAGACAAC CC CCAT CT GCT CAC CATC 1311 

I I I I I I I I I I I II III I III I I I I I I I I I 

1208 GT CT GCAGGACC CTCT GGACAAGG AGCT CAT GACAGAGT CCT CACT CTT TAAC C CTT 1264 

1312 C AGC C GGAC CT CAGCACCACCACCACC ACCT AC CAGGGC AGT CT CT GT CCC CGGCAGGAT 1371 

II I I I I I I I I I I I I III 

1265 T GT C GGACAT CAAAGT GAAAGTC CAGAGCT CGT T CAT GGTTT C C CT GGGAGT GT CT GAGA 1324 

1372 GGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGC 1431 

I I I I I II I I III III I 

1325 GAGCT GAGT AC C ACGGCAAGAAT CATT CC AGGACTTTT 1362 

1432 CGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTC 1491 
I I I I I I I I I I I I I I I II III I I I I I I I 

CCCCATGGAAACAACCACAGCTTTAGTACAATGCATCCCAGAAATAAAATGCCCTACATC 1422 



1363 



1492 TCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGGACC 1551 

III I I I I I I I I I I I I I I I III I 

1423 CAAAATCTG T CAT CACT CCC CACAAGGACAGAACT GAGGACAACT GGT GTC 1473 

1552 TTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCC 1611 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1474 TTTGGCCATTTAGGGGGGCGCTTAGTAATGCCAAATACAGGGGTGAGCTTACTCATACCA 1533 

1612 C CAGAT GCC AT AC CC C GAGGGAAGATCT ATGAGAT CT AC CT CAC GCT GCACAAGCC GGAA 1671 

I I I I I I II I I I II I I I I I I I I I I I I I I I I I 

1534 C AC GGT GCCAT C C CAGAGGAGAAT T CTT GGGAGATT T AT AT GT C CAT CAACCAAGGT 1590 

1672 GACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGA 1731 

II II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1591 GAAC CCAGCCT C CAGT CAGAT GGCT CT GAGGT GCT C CT GAGT C CT GAAGT C AC CTGTGGT 1650 

1732 CCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCC 1791 

I I I I I I I I I I I I I II I I I I I I I I I I I I I II I 

1651 C CT CC AGACAT GAT C GT CAC CACT C CCTTTGCATT GACCAT CC C GCACT GT GCAGAT GT C 1710 

1792 AGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGAT 1851 



II 1 1 1 1 1 1 1 1 II I 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 1711 AGTTCT GAGCATT GGAAT AT C CATTTAAAGAAGAGGACACAGC AGGGCAAATGGGAGGAA 1770 

Qy 1852 GTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGT 1911 

M I II I I I I I I I I III II I I I I I I I I I I I II I 

Db 1771 GT GAT GT C AGT GGAAGAT GAAT CT ACATC CTGTTACTGCCTTTTGGACCCCTTT 1824 

Qy 1912 GCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGC 1971 

I I I I III II II III I I I I I I I I I I I II I III 

Db 1825 GC GT GTCATGT GCT C CT GGACAGCTTT GGGACCT AT GC GCT CACT GGAGAGCCAAT CACA 1884 

Qy 1972 GTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTC 2031 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 1885 GACTGTGCCGTGAAGCAACTGAAGGTGGCGGTTTTTGGCTGCATGTCCTGTAACTCCCTG 1944 

Qy 2032 GAGT ACAACAT C CGGGT CT ACT GC CT GCAT GACAC C C ACGAT GCACT CAAGGAGGT GGT G 2091 

I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I 

Db 1945 GATT ACAACT T GAGAGTTT ACT GT GT GGACAAT ACC C CTT GTGC ATTT CAGGAAGT GGTT 2004 

Qy 2092 CAGCT GGAGAAGCAGCT GGGGGGACAGCTGATC C AGGAGC CAC GGGT CCT GCACTT CAAG 2151 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 2005 T CAGATGAAAGGCAT CAAGGT GGACAGCTC CT GGAAGAAC CAAAAT T GCT GCATTT CAAA 2064 

Qy 2152 GACAGTTAC C ACAAC CT GCGCCT AT C CAT C CAC GAT GT GCC CAGCTC C CT GTGGAAGAGT 2211 

I II I I III III III I I I I I II I I I I I I I I II 

Db 2065 GGGAAT ACCTTT AGT CTT CAGAT T T CT GT CCTT GAT AT TCC CCC ATT CCT CTGGAGAATT 2124 

Qy 2212 AAGCT CCTT GT CAGCT ACCAGGAGAT CCCCTTTT AT CACAT CT GGAAT GGCAC GCAGC GG 2271 

III I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 2125 AAACCATTCACTGCCTGCCAGGAAGTCCCGTTCTCCCGCGTGTGGTGCAGTAACCGGCAG 2184 

Qy 2272 TACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGC 2331 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I 
Db 2185 CCCCTGCACTGTGCCTTCTCCCTGGAGCGTTATACGCCCACTACCACCCAGCTGTCCTGC 2244 

Qy 2332 AAGCT GT GGGT GTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGC AT CAACTTCAACATC 2391 

II III I I I I I I I I I I I I I I I II I II I I III 

Db 2245 AAAAT CT GCATT C GGCAGCT CAAAGGCCAT GAACAGAT CCT C CAAGT GCAGACAT CAAT C 2304 

Qy 2392 AC CAAGGAC ACAAGGTTT GCT GAGCTGCTGGCT CT GGAGAGT GAAGC GGGGGT CC CAGC C 2451 

II II I I I II I I I I I I 

Db 2305 CTAGAGAGTGAACGAGAAAC CAT C ACTTTCTT C GC ACAAGAGGACAGCACTTT CCCT GCA 2364 

Qy 2452 CTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGC 2511 

II I I I I I I I I I I I I I I I I I I I II I III I I II Ml III 
Db 2365 C AGACT GGC CCCAAAGC CTT CAAAATT C CCT ACT C CAT CAGACAGCGGAT TT GT GCT ACA 2424 

Qy 2512 CTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTG 2571 

III I I I I I II I I I I I I I I I I I I I I I I I I I II 

Db 2425 TT TGAT AC C CCCAAT GC CAAAGGCAAGGACT GGC AGAT GTT AGCACAGAAAAACAGCAT C 2484 

Qy 2572 GACAGCCAT CT CAGCTT CTTT GC CT CCAAGC C CAGCC C CACAGC C AT GAT C CT CAAC CTG 2631 

I I I I Ml I I I I I I I I I I II III III I I I I I I I 

Db 2485 AACAGGAAT TT AT CT TATTT CGCT ACACAAAGT AG C C CAT CT GCT GT CATT TT GAACCT G 2544 

Qy 2632 TGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGA 2691 

I I I I I M II I I I III III I I I II I II II I 



Db 2545 TGGGAAGCTCGTCATCAGCATGATGGTGATCTTGACTCCCTGGCCTGTGCCCTTGAAGAG 2604 



Qy 2692 CT GGGC CAGC C AGACGCT GGCCT CTT C ACAGTGT C GGAGGCTGAG 2736 

Ml I I I I I I I I I I I I I I I I I I I 

Db 2605 ATT GGGAGGACACACACGAAACT CT CAAAC AT TT CAGAAT CCCAG 2649 



RESULT 12 
US-09-969-532-15 

; Sequence 15, Application US/09969532 

; Patent No. 6777232 

; GENERAL INFORMATION: 

; APPLICANT: Walke, D. Wade 

; APPLICANT: Scoville, John 

; TITLE OF INVENTION: No. 6777232el Human Membrane Proteins and Polynucleotides 
Encoding the Same 

; FILE REFERENCE: LEX-0244-USA 

; CURRENT APPLICATION NUMBER: US/09/969, 532 

; CURRENT FILING DATE: 2001-10-02 

; PRIOR APPLICATION NUMBER: US 60/237,280 

; PRIOR FILING DATE: 2000-10-02 

; NUMBER OF SEQ ID NOS: 33 

; SOFTWARE: FastSEQ for Windows Version 4.0 
; SEQ ID NO 15 

LENGTH: 2661 

TYPE: DNA 
; ORGANISM: homo sapiens 
US-09-969-532-15 

Query Match 16.0%; Score 439.8; DB 4; Length 2661; 

Best Local Similarity 51.2%; Pred. No. 9.9e-89; 

Matches 1313; Conservative 0; Mismatches 1147; Indels 105; Gaps 8; 



Qy 172 CT TC CCC ACT T CCT GGT GGAGC C C GAGGAT GT GT AC AT CGT CAAGAACAAGCCAGT GCTG 231 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 157 CT GCCT CAT T T C AT AGAGGAGC C AGAT GAT GCT T AT ATTAT CAAGAGCAAC CCTATT GCA 216 

Qy 232 CTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTG 291 

II I I I I I I II III I I I I I II I I I I I I II I I I I I I I I I I I I II I I I I I 

Db 217 CTCAGGTGCAAAGCGAGGCCAGCCATGCAGATATT CTT CAAAT GCAACGGCGAGT GGGTC 276 

Qy 292 CGCCAGGTGGACCACGTGAT CGAGCGCAGCACAGACGGGAGCAGT GGGCT GCCCACCATG 351 

I III I I I I I I I II I I I I I I I I I II II I 

Db 277 CATCAGAACGAGCACGTCTCTGAAGAGACT CTGGACGAGAGCT CAGGTTTGAAGGTCCGC 336 

Qy .. 352 GAGGTCCGCATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCTGGAGGAATAC 411 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 337 GAAGT GT T CAT CAAT GT T ACT AGGCAACAGGT GGAGGACT T CC AT GGGCC C GAGGACT AT 396 

Qy 412 T GGT GCCAGT GC GT GGCAT GGAGCT CCT CGGGC AC CACCAAGAGT C AGAAGGC CT AC AT C 471 

M I I I I II I I I I I I I I I II I I I I I I I I 1 I I I I I I I I I I I I I I I I I 
Db 397 T GGT GCCAGT GTGTGG CGT GGAGC C AC CTGGGT AC CTCCAAGAGCAGGAAGGCCTCTGTG 456 

Qy 472 CGCATAGCCAGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTG 531 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I III 
Db 457 CGCAT AGC CT ATTT ACGGAAAAACT TT GAACAAGACC C ACAAGGAAGGGAAGTT CC C ATT 516 



Qy 532 GAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAG 591 

II I I I I I I I I I I I I I I I I I I I | | | | | I I I I I I I I I I I I I I I I I 

Db 517 GAAGGCATGATTGTACTGCACTGCCGCCCACCAGAGGGAGTCCCTGCTGCCGAGGTGGAA 576 

Qy 592 TGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATCACGCGG 651 

I M I I I I I I I I I I I II I I III II I I I I I I I 

Db 577 T GGCT GAAAAAT GAAGAGCCC ATT GACT CT GAACAAGACGAGAACATT GAC ACCAGGGCT 636 

Qy 652 GAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTG 711 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 637 GACC ATAACCT GAT CAT CAGGC AGGC ACGGCT CT CGGACT CAGGAAATTACACCT GCAT G 696 

Qy 712 GCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAAC 771 

II I I I I I I II II I I I I I I I I I I I I I I I I I I I II I I I I 

Db 697 GCAGCCAACAT CGT GGCT AAGAGGAGAAGCCT GT CGGC CACT GT T GT GGT CT ACGT GGAT 756 

Qy 772 GGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGG 831 

II I I I I I I I II II I I I I I I II I I I I I I I I I I I I 
Db 757 GGGAGCT GGGAAGT GTGGAGC GAAT GGT CCGTCTGCAGTCCAGAGT GT G AA 807 

Qy 832 CAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAG 891 

II I I I I I I I I I I I I I II III I I I I I I I I I I I I I I I I 

Db 808 CAT TT GC GGAT CC GGGAGT GC AC AGC ACCAC C C C CGAGAAAT GGGGGCAAATT CT GT GAA 867 

Qy 892 GGGC AGAAT GT C CAGAAAACAGCCT GC GCC ACC CT GT GCC CAGT AGAC GGC AGCT GGAGC 951 

I I I I I I I I I I I I I I I I II 

Db 868 GGTCTAAGC C AGGAAT CT GAAAACT GCACAGAT GGT CTTT GCAT CCTAGGCATT GAGAAT 927 

Qy 952 CCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGC 1011 

II II I I I I I I I I I 
Db 928 GCCAGCGACATTGCTTTGTACTCGGGCTTGG 958 

Qy 1012 T CT GACC C AGC ACCC C GCAAC GGAGGGGAGGAGT GC CAGGGCACT GAC CT GGAC AC C C GC 1071 

I I I I I I I I I I I I II 

Db 959 GTGCTGCCGTCGTGGCCGTTGCAGTCCTGGTCATTGGTGTCACC 1002 

Qy 1072 AACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTAT 1131 

II I II III III I I III III 

Db 1003 CTTT ACAGACGGAGC CAGAGT GACT AT GGC GT GGAC GT CATT GACT CTT CT GCATT GAC A 1062 

Qy 1132 GTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTT 1191 

I I I I II III III I I I I I I I I I I I I I 

Db 1063 GGTGGCTTCCAGACCTTCAACTTCAAAACAGTCCGTCAAGGTAACTCCCTGCTCCTGAAT 1122 

Qy 1192 T ATT GCCGGAAGAAG GAGGGGCT GGACT CAGAT GT GGCT GACT C GT C C ATT CT CAC CT CA 1251 

I Jill I I I I I I I III I |. I I I 

Db 1123 TCTGCCATGCA GCCAGATCT GAC AGT GAGC CGGACAT AC AGCGGAC C CAT CT 1174 

Qy 1252 GGCTT C C AGC C C GT C AGCAT CAAGC CCAGCAAAGCAGACAAC CC C CAT CT GCT CAC CATC 1311 

I I I I I I I I I I I II III I III I I I I I I I I I 

Db 1175 GT CT GCAGGAC C CT CTG GACAAGG AGCT CAT GACAGAGTCCT CACT CTTTAACC CTT 1231 

Qy 1312 CAGCCGGACCT CAGCACCACCACCACCACCTACCAGGGCAGTCT CTGT CCCCGGCAGGAT 1371 

II I I I I I I I I I I I I III 

Db 1232 T GT C GGACAT CAAAGT GAAAGT CCAGAGCT C GTT CAT GGTTTCCCT GGGAGT GT CT GAGA 1291 



Qy 



1372 GGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGC 1431 



I 1 1 1 1 1 1 1 I 1 1 1 III I 

Db 1292 GAGCT GAGTACCACGGCAAGAAT CATT CC AGGACTTTT 1329 

Qy 1432 CGCCACACACT GCACCACAGCT CT C C CAC CT CTGAGGCCGAGGAGTT C GT CTCCC GCCT C 1491 

I I I I I I I I I I I I II I II III I I II I I I 

Db 1330 CCC C ATGGAAACAAC CAC AGCTTT AGT ACAAT GCAT CCCAGAAAT AAAAT GC CCT ACATC 1389 

Qy 1492 T C CAC CCAGAACTACTTC CGCT CC CT GCC C CGAGGCAC CAGCAACATGACCT ATGGGAC C 1551 

III I I I I I I I I I I I I I I I III I 

Db 1390 CAAAATCTGT CAT CACT CC C CACAAGGACAGAACT GAGGACAACT GGT GT C 144 0 

Qy 1552 TTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCC 1611 

II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 1441 TTTGGCCATTTAGGGGGGCGCTTAGTAATGCCAAATACAGGGGTGAGCTTACTCATACCA 1500 

Qy 1612 CCAGAT GC CAT ACC C C GAGGGAAGAT CT AT GAGAT CT AC CT CAC GCT GCAC AAGC CGGAA 1671 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 1501 C AC GGTGCCAT C CCAGAGGAGAATT CTT GGGAGATT T ATAT GT CCAT CAACCAAGGT 1557 

Qy 1672 GACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGA 1731 

II II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1558 GAAC C C AG C CT C C AGT C AGAT GGCT CT GAGGT G CT C CT G AGT CCT GAAGT CAC CT GT GGT 1617 

Qy 1732 CCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCC 1791 

II II I I I I I I I I I II I Mill I I I I I I I I I I 

Db 1618 CCTCCAGACATGATCGTCACCACTCCCTTTGCATTGACCATCCCGCACTGTGCAGATGTC 1677 

Qy 1792 AGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGAT 1851 

I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I 

Db 1678 AGT T CTGAGC ATT GGAATATC C ATT TAAAGAAGAGGAC AC AGCAGGGCAAAT GGGAGGAA 1737 

Qy 1852 GTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGT 1911 

I I I I I III II I I I III II I I I I I I I I I I I II I 

Db 1738 GT GAT GT C AGT GGAAGAT GAAT CT AC AT C CTGTTACTGCCTTTTGGACCCCTTT 1791 

Qy 1912 GCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGC 1971 

I I I I I I I II II III I I II I I I I I I I I I I III 

Db 17 92 GC GT GT CAT GT GCT C CT GGACAGCTTT GGGACCT AT GC GCT CACTGGAGAGCCAAT CACA 1851 

Qy 1972 GTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTC 2031 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1852 GACTGTGCCGTGAAGCAACTGAAGGTGGCGGTTTTTGGCTGCATGTCCTGTAACTCCCTG 1911 

Qy 2032 GAGTACAACATCCGGGTCT ACT GCCT GCAT GACACCCACGATGCACTCAAGGAGGTGGTG 2091 

I I I I I I I I I I I I I I I I I III I I I I I Mill I I I I I II I I 

Db 1912 GAT T ACAACTT GAGAGT TT ACT GT GT GGACAAT AC C C CT T GTGC ATT T C AGGAAGT GGT T. .1971 

Qy 2092 C AGCT GGAGAAGC AGCT GGGGGGAC AGCT GAT C CAGGAGC CACGGGT C CT G C ACT T CAAG 2151 

II I M I I II I I II II I I I I I I I M I I II II I I I I I 

Db 1972 TCAGATGAAAGGC AT CAAGGT GGAC AGCT CCT GGAAGAACCAAAATT GCT GC ATT T CAAA 2031 

Qy 2152 GACAGTT ACCACAACCT GC GC CT AT C CAT CCAC GAT GT GC C CAGCT CC CT GT GGAAGAGT 2211 

I II I I III III III II I I I II I II I M II II 
Db 2032 GGGAATACCTTTAGTCTTCAGATTTCTGTCCTTGATATTCCCCCATTCCTCTGGAGAATT 2091 

Qy 2212 AAGCTCCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACGCAGCGG 2271 

M I I I I I II II I II II I I I I I I II I II I I I I 



Db 



2092 AAACCATTCACTGCCTGCCAGGAAGTCCCGTTCTCCCGCGTGTGGTGCAGTAACCGGCAG 2151 



Qy 2272 TACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGC 2331 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I 
Db 2152 CCCCTGCACTGTGCCTTCTCCCTGGAGCGTTATACGCCCACTACCACCCAGCTGTCCTGC 2211 

Qy 2332 AAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAACATC 2391 

II III I I I I I I I I I II I I I I I I I I I I I III 

Db 2212 AAAATCT GCATTCGGCAGCT CAAAGGCCAT GAAC AGAT CCT CCAAGTGCAGAC AT CAAT C 2271 

Qy 2392 ACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCC 2451 

II II I I I II I I I I I I 

Db 2272 CT AGAGAGT GAAC GAGAAAC CAT C ACT TTCT T CGC ACAAGAGGACAGCACTTT CC CT GCA 2331 

Qy 2452 CTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGC 2511 

II I I I I I I I I I I I I I I I I I I I I I I III I I I I III III 
Db 2332 C AGACT GGC C C CAAAGCCTT CAAAATT CCCT ACT C CAT C AGAC AGC GGATTT GTGCTAC A 2391 

Qy 2512 CTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTG 2571 

III I I II I II I I I I I I I I I I I I I I I I I I I II 

Db 2392 TTTGAT ACCCCCAAT GCCAAAGGCAAGGACTGGCAGATGTT AGCACAGAAAAACAGCAT C 2451 

Qy 2572 GAC AGC CAT CT CAGCTT CT T T GCCT CCAAGC C CAGC C CC ACAGC CATGAT CCT CAAC CT G 2631 

I I I I II I I I I I I I I I I I I I III III I I I I I I I 

Db 2452 AAC AGGAAT T TAT CTT ATTT CGCT ACACAAAGT AG C C CATCT GCT GTCATTTT GAAC CT G 2511 

Qy 2632 TGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGA 2691 

I I I I I I I I I I I I III III I I I I I I II II I 

Db 2512 T GGGAAGCT CGT CAT C AGCAT GAT GGT GAT CTTGACT C C CT GGC CT GT GC CCTTGAAGAG 2571 

Qy 2692 CT GGGC CAGC CAGACGCT GGCCT CTTCACAGT GT C GGAGGCT GAG 2736 

III I I I I I I I I I I I I I I I I I II 

Db 2572 ATT GGGAGGACACACAC GAAACT CT CAAACATTT CAGAATC C CAG 2616 
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LENGTH: 349 
TYPE: DNA 
ORGANISM: 
FEATURE : 
NAME/ KEY: 
LOCATION: 
NAME/KEY: 
LOCATION: 
OTHER INFORMATION 
OTHER INFORMATION 



Homo sapiens 
CDS 

207. .347 
sig_peptide 
207. .278 

Von Heijne matrix 
score 5.40000009536743 



OTHER INFORMATION: 
US-09-471-276-345 



seq SCCCLSSSSFIAG/RR 



Query Match 11.7%; 
Best Local Similarity 98.8%; 
Matches 335; Conservative 



Score 323; DB 4; Length 349; 
Pred. No. 6.9e-63; 
1; Mismatches 2; Indels 



Qy 

Db 



1 ; Gaps 



l; 



934 GTAGACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTiGCACCCAC 993 
II I II II I I I I I I I I I I t I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
12 GTGGACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCAC 71 



Qy 

Db 

Qy 
Db 



994 TGGCGGAGCCGTGAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGC 1053 
I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I II I I I I I I I I I I I I I I I 
72 TGGCGGA- C CGT GAGTGCT CT GACCC AGCAC CCC GCAACGGAGGGGAGGAGT GC C AGGGC 



1054 ACT GAC CT GGACACCCGCAACT GT AC C AGT GAC CT CT GT GTACACAGT GCTT CT GGCC CT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I 
131 ACT GAC CT GGACAC C CGCAACT GT AC CAGT GAC CT CT GT GTAC ACACT GCTT CT GGCC CT 



130 



1113 



190 



Qy 

Db 

Qy 
Db 

Qy 

Db 



1114 GAGGACGTGGCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTG 1173 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I : I I I I I I I I I I I I I I 

191 GAGGACGTGGCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCBTGGTCCTGCTGCTG 250 

1174 CTTGTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGAC 1233 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CT T GT C CT CAT C CT C GT TT AT T GCC GGAAGAAGGAGGGGCTGGACT CAGAT GT GGCT GAC 310 



251 



1234 



311 



TCGT CCATT CT CAC CT C AGGCTT C C AGC CCGTC AGCATC 1272 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TCGTCCATTCTCACCTCAGGCTTCCAGCCCGTCAGCATC 34 9 



RESULT 14 
US--09-969-532-31 

; Sequence 31, Application US/09969532 

; Patent No. 6777232 

; GENERAL INFORMATION: 

; APPLICANT : Walke, D. Wade 

; APPLICANT: Scoville, John 

; TITLE OF INVENTION: No. 6777232el Human Membrane Proteins and Polynucleotides 

Encoding the Same 

; FILE REFERENCE: LEX- 02 4 4 -USA 

; CURRENT APPLICATION NUMBER: US/09/969,532 

; CURRENT FILING DATE: 2001-10-02 

; PRIOR APPLICATION NUMBER: US 60/237,280 

; PRIOR FILING DATE: 2000-10-02 

; NUMBER OF SEQ ID NOS: 33 



SOFTWARE: FastSEQ for Windows Version 4.0 
; SEQ ID NO 31 
LENGTH: 1968 
TYPE: DNA 

ORGANISM: homo sapiens 
US-09-969-532-31 

Query Match 10.7%; Score 293.2; DB 4; Length 1968; 

Best Local Similarity 53.7%; Pred. No. 5.8e-56; 

Matches 657; Conservative 0; Mismatches 558; Indels 9; Gaps 2; 



Qy 1513 TCCCTGCCCCGAGGCACCAGCAACATGACCTATGGGACCTTCAACTTCCTCGGGGGCCGG 1572 

I I I I I I I I I I I I I I I III III I I I I I I I I I 

Db 709 TCACTCCCCACAAGGACAGAACTGAGGACAACTGGTGTCTTTGGCCATTTAGGGGGGCGC 768 

Qy 1573 CT GAT GAT CCCTAATACAGGT ATCAGCCT C CT CAT CCCCCC AGATGC CAT ACCCCGAGGG 1632 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 769 TT AGT AAT GCCAAAT ACAGGGGTGAGCTT ACT CAT ACCACACGGTGC CAT C C CAGAGGAG 828 

Qy 1633 AAGAT CT ATGAGAT CT ACCTC ACGCT GCACAAGCC GGAAGACGT GAGGT T GC CC CTAGCT 1692 

II I I I I I I I I I I I II I I I I I I I I I III 

Db 829 AAT T CT T GGGAGATTT AT AT GT CCAT CAAC CAAGGT GAAC CC AGCCT CC AGT CAGAT 885 

Qy 1693 GGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCTGGCGTCCTGCTCACC 1752 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 886 GGCTCTGAGGTGCTCCTGAGTCCTGAAGTCACCTGTGGTCCTCCAGACATGATCGTCACC 945 

Qy 1753 CGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCTGACAGCTGGAGCCTG 1812 

II I I I I I I I I I I I II II III II I I I I I I I 

Db 946 ACT CC CTTTGC ATT GAC CATCCCGCACT GT GCAGAT GT CAGTT CTGAGCAT T GGAAT AT C 1005 

Qy 1813 CGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAG 1872 

I I I I I I I II I I I I I I I I I I I I I I I I I I I III I I I I 

Db 1006 CAT TTAAAGAAGAGGACACAGCAGGGCAAAT GGGAGGAAGT GAT GT CAGT GGAAGAT GAA 1065 

Qy 1873 GCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAG 1932 

I I I I II I I I I I I I I I I I II I I I I I III II II 

Db 1066 TCTACATC CTGTTACTGCCTTTTGGACCCCTTTGCGTGTCATGTGCTCCTGGAC 1119 

Qy 1933 CAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTC 1992 

III I I I I I II I I I I I I I III I Mill I I I I I I 

Db 1120 AGCTTTGGGAC CTAT GC GCT CACT GGAGAGCCAAT CACAGACT GTGC CGT GAAGCAACT G 1179 

Qy 1993 AAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAACATCCGGGTCTAC 2052 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I II III 

Db 1,1.80 AAGGT GGC GGT TTTT GGCT GCAT GT C CTGTAACTC CCT GGATT ACAACT T GAGAGTTT AC 1239 

Qy 2053 TGCCTGCATGACACCCACGATGCACTCAAGGAGGTGGTGCAGCTGGAGAAGCAGCTGGGG 2112 

II III I I II I I I I I I I I I I I I I I I II I I I I I I I 

Db 1240 TGT GT GGACAAT ACC C CT T GT GCAT T T CAGGAAGT GGTTT CAGAT GAAAGGC AT CAAGGT 1299 

Qy 2113 GGAC AGCT GAT CCAGGAGC CAC GGGT CCT GCACTT CAAGGACAGTT AC C AC AAC CTGC GC 2172 

I I I I I I I I I I II Ml I I I I I I I I I I I I II I I III 

Db 1300 GGAC AGCT CCT GGAAGAAC CAAAAT T GCT GCAT TT CAAAGGGAATACCT T T AGT CTT C AG 1359 

Qy 2173 CTAT C CAT C CACGAT GT GC C C AGCT C C CT GT GGAAGAGT AAGCT CCTT GT C AGCT AC C AG 2232 

III Ml I II I I I I I I I I I I II I I I I I I I I I II I 



Db 1360 ATTTCTGTCCTTGATATTCCCCCATTCCTCTGGAGAATTAAACCATTCACTGCCTGCCAG 1419 

Qy 2233 GAGAT CC CCTTTT AT CACAT CTGGAAT GGCACGC AGC GGTACTT GCACT GCAC CTT CACC 2292 

II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 1420 GAAGTCCCGTTCTCCCGCGTGTGGTGCAGTAACCGGCAGCCCCTGCACTGTGCCTTCTCC 1479 

Qy 2293 CTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTG 2352 

I I I I I I I I I I I I I I III I I I I I I I I I I I III I I I I I I I 
Db 1480 CTGGAGCGTTATACGCCCACTACCACCCAGCTGTCCTGCAAAATCTGCATTCGGCAGCTC 1539 

Qy 2353 GAGGGC GAC GGGCAGAGCTT CAGC ATCAACT T CAACAT CAC CAAGGACACAAGGT TT GCT 2412 

I I I I I I I I I I I I I II III II II I 

Db 1540 AAAGGC CAT GAAC AGAT CCT CCAAGT GCAGACAT CAAT C CT AGAGAGT GAAC GAGAAACC 1599 

Qy 2413 GAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTC 2472 

I I II I I II I I I I I I I I I I I I I I I I I 

Db 1600 AT CACTTTCTT C GCACAAGAGGACAGC ACTT T CC CT GCACAGACT G GC C CCAAAGCCTT C 1659 

Qy 2473 AAGAT C CCCT T CCT CAT T CGGCAGAAGATAAT TT CCAGC CT GGACCCACCCT GTAGGCGG 2532 

I I I I I I I I I III I I I I III III III I I I I I 

Db 1660 AAAATT C CCT ACT C CAT CAGACAGC GGATTT GT GCT ACATTT GAT ACC CCCAATGCCAAA 1719 

Qy 2533 GGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAGCCATCTCAGCTTCTTT 2592 

II II I I I I I I I I I I I I I I I I I II I I I I Ml I II 

Db 1720 GGCAAGGACT GGC AGAT GTT AGC AC AGAAAAACAGC AT CAAC AGGAAT TT AT CTT ATTT C 1779 

Qy 2593 GCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGGGAGGCGCGGCACTTCCCC 2652 

II I I I I I I I III III I I I I I I I I I I I I I I I I I I I 

Db 1780 GCT ACACAAAGT AGCCCAT CT GCT GTC ATT T T GAACCT GTGGGAAGCT CGT CATCAGCAT 1839 

Qy 2653 AACGGCAAC CT CAGCCAGCT GGCT GCAGCAGT GGCT GGACT GGGC CAGCC AGACGCT GGC 2712 

III III I I I I I I II II I III I I I I I I 

Db 1840 GAT GGT GAT CT T GACT C CCT GGCCT GT GC CCTT GAAGAGAT T GGGAGGACACACACGAAA 1899 

Qy 2713 CTCTTCACAGTGTCGGAGGCTGAG 2736 

I I I I I I I I I I I II 
Db 1900 CT CT CAAACAT TT C AGAAT C C C AG 1923 



RESULT 15 
US-09-969-532-29 

; Sequence 29, Application US/09969532 

; Patent No. 6777232 

; GENERAL INFORMATION: 

; APPLICANT: Walke, D. Wade 

; APPLICANT: Scoville, John 

; TITLE OF INVENTION: No. 6777232el Human Membrane Proteins and Polynucleotides 

Encoding the Same 

; FILE REFERENCE: LEX- 02 4 4 -USA 

; CURRENT APPLICATION NUMBER: US/09/969,532 

; CURRENT FILING DATE: 2001-10-02 

; PRIOR APPLICATION NUMBER: US 60/237,280 

; PRIOR FILING DATE: 2000-10-02 

; NUMBER OF SEQ ID NOS : 33 

; SOFTWARE: FastSEQ for Windows Version 4.0 
; SEQ ID NO 29 
LENGTH: 2001 



TYPE: DNA 
; ORGANISM: homo sapiens 
US-09-969-532-29 



Query Match 10.7%; Score 293.2; DB 4; Length 2001; 

Best Local Similarity 53.7%; Pred. No. 5.8e-56; 

Matches 657; Conservative 0; Mismatches 558; Indels 9; Gaps 2; 



Qy 1513 TCCCTGCCCCGAGGCACCAGCAACATGACCTATGGGACCTTCAACTTCCTCGGGGGCCGG 1572 

I I I I I I I I I I I I I I I III III I I I I I I I I I 

Db 742 TCACT CCCCACAAGGACAGAACT GAGGACAACTGGTGTCTTTGGCCATTTAGGGGGGCGC 801 

Qy 1573 CT GAT GAT C CCTAAT ACAGGT AT CAGCCT CCT C ATC C CCC CAGAT GCCAT ACCC CGAGGG 1632 

I I I I I I I I I I I I I I I I I.I I I I I I I I I I I I I I I I I I I II 
Db 802 TT AGTAAT GCCAAAT AC AGGGGT GAGCTT ACT CAT AC CACACGGT GCCAT CC CAGAGGAG 861 

Qy 1633 AAGAT CT AT GAGAT CT AC CT C AC GCT GC ACAAGCCGGAAGAC GTGAGGT T GC CCCT AGCT 1692 

II I I I I I I I I I I I I I I I I I I I I I I III 

Db 862 AAT T C T T G G GAGAT T TAT AT G T C CAT C AAC C AAG GT G AAC C C AGCCTCCAGTCAGAT 918 

Qy 1693 GGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCTGGCGTCCTGCTCACC 1752 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 919 GGCTCT GAGGT GCT C CT GAGT C CT GAAGT CAC CT GT GGT C CT CCAGACAT GATC GT CACC 978 

Qy 1753 CGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCTGACAGCTGGAGCCTG 1812 

II I I I I I I I I I I I I I II III I I I I I I I I I 

Db 979 ACT CCCTTTGCATT GACCAT CCC GCACT GT GC AGAT GT CAGTT CT GAGCATT GGAAT AT C 1038 

Qy 1813 C GC CT CAAAAAGCAGT CGT GCGAGGGCAGCT GGGAGGAT GT GCTGCACCT GGGC GAGGAG 1872 

I I I I I I I II I I II I I I I I I I I I I I I I I I I II I I I I 

Db 1039 CATTTAAAGAAGAGGACACAGCAGGGCAAATGGGAGGAAGTGATGTCAGTGGAAGATGAA 1098 

Qy 1873 GCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAG 1932 

I III II I I I I I I I I I I I II I I I I I III II II 

Db 1099 TCTACATC CTGTTACTGCCTTTTGGACCCCTTTGCGTGTCATGTGCTCCTGGAC 1152 

Qy 1933 CAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTC 1992 

III I I I I I I I I I I I I I I III I I I I I I I I I I II 

Db 1153 AGCTTT GGGAC CT AT GCGCT CACT GGAGAGC CAAT CACAGACT GT GC C GT GAAGCAACT G 1212 

Qy 1993 AAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAACATCCGGGTCTAC 2052 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1213 AAGGT GGCGGT T TTT GGCT GCAT GT CCT GTAACT CC CT GGATT ACAACTTGAGAGTTTAC 1272 

Qy 2053 TGCCTGCATGACACCCACGATGCACTCAAGGAGGTGGTGCAGCTGGAGAAGCAGCTGGGG 2112 

II III I I I I I Mill I I I I I I I I I I II I I I I II 

Db 1273 T GT GT GGACAAT AC C CCT T GT GC AT TT CAGGAAGT GGTT TC AGAT GAAAGGCAT CAAGGT 1332 

Qy 2113 GGACAGCTGAT CCAGGAGCCACGGGTCCT GCACTTCAAGGACAGTTACCACAACCTGCGC 2172 

I I I I I I I I I I I I II I I I I I I I I I I I I I II I I III 

Db 1333 GGACAGCTCCTGGAAGAACCAAAATTGCTGCATTTCAAAGGGAATACCTTTAGTCTTCAG 1392 

Qy 2173 CT AT C C AT CC AC GAT GT GC CC AGCT CC CT GTGGAAGAGTAAGCTCCTT GT CAGCT AC CAG 2232 

III III I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 1393 ATT T CT GT C CT T GAT AT T C CC CC ATTC CT CTGGAGAATTAAAC CATT CACT GCCT GCCAG 1452 

Qy 2233 GAGAT C CCCT T T TAT CACAT CT GGAAT GGC AC GCAGC GGT ACTTGC ACT GC ACCTTC AC C 2292 



Db 



II I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

1453 GAAGTCCCGTTCTCCCGCGTGTGGTGCAGTAACCGGCAGCCCCTGCACTGTGCCTTCTCC 1512 



Qy 2293 CTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTG 2352 

I I I I ! I I I I I I I I I III I I I I I I I I I I I III I I I I I I I 

Db 1513 CTGGAGCGTTATACGCCCACTACCACCCAGCTGTCCTGCAAAATCTGCATTCGGCAGCTC 1572 

Qy 2353 GAGGGC GAC GGGCAGAGCTT CAGCAT CAACTT CAACAT C AC CAAGGAC ACAAGGTTT GCT 2412 

I I I I I I I I I I I I I II III II II I 

Db 1573 AAAGGCCAT GAACAGATC CT CCAAGTGCAGACAT C AAT C CT AGAGAGT GAAC GAGAAAC C 1632 

Qy 2413 GAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTC 2472 

I I II I I I I I I I I I I I I I I I I I I I I I 

Db 1633 ATCACTTTCTTCGCACAAGAGGACAGCACTTTCCCTGCACAGACTGGCCCCAAAGCCTTC 1692 

Qy 2473 AAGAT C C CCTT C CT CATT CGGCAGAAGATAAT TT C C AGCCT GGAC C CAC CCT GTAGGC GG 2532 

II II I I II. I III I I I I III III III I Ml I 

Db 1693 AAAATT CC CT ACT C CAT C AGACAGCGGAT T T GT GCT ACATT T GAT ACC C CCAAT GCCAAA 1752 

Qy 2533 GGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAGCCATCTCAGCTTCTTT 2592 

II I I I I I I I I I I I I I I I I I I I II I I I I III I II 

Db 1753 GGCAAGGACT GGCAGAT GT T AGCAC AGAAAAACAGCAT CAAC AGGAATTT AT CTT ATTT C 1812 

Qy 2593 GCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGGGAGGCGCGGCACTTCCCC 2652 

II I I I I I I I III III I I I I I I I I I I I I I I I I I I I 

Db 1813 GCTACACAAAGTAGCCCATCTGCT GTCATTTTGAACCT GTGGGAAGCT CGT CATCAGCAT 1872 

Qy 2653 AACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGGCCAGCCAGACGCTGGC 2712 

III III I I I I I I II II I III I I I I I I 

Db 1873 GAT GGT GAT CTTGACT CCCTGGCCTGTGCCCTT GAAGAGATT GGGAGGACACACACGAAA 1932 

Qy 2713 CT CT T CACAGT GT C GGAGGCT GAG 2736 

I I I I I I I I I I I II 
Db 1933 CTCT CAAACATTT CAGAATCCCAG 1956 



Search completed: March 6, 2005, 10:24:41 
Job time : 450.33 sees 



GenCore version 5.1.6 
Copyright (c) 1993 - 2005 Compugen Ltd. 



OM nucleic - nucleic search, using sw model 
Run on: 



Title: 

Perfect score: 
Sequence : 

Scoring table: 



Searched: 



March 6, 2005, 05:25:16 ; Search time 1488.37 Seconds 

(without alignments) 
10971.677 Million cell updates/sec 

US-10-624-932-1 
2752 

1 ccgcggggccccgcgcccgg tgagtgctgaggccggccag 2752 

IDENTITY_NUC 

Gapop 10.0 , Gapext 1.0 



5401638 seqs, 2966923429 residues 



Total number of hits satisfying chosen parameters: 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 



10803276 



Database : 



Published_Applications_NA: * 
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/cgn2_6/ptodata/2/pubpna/US07_PUBCOMB.seq:* 
/cgn2_6/ptodata/2/pubpna/PCT_NEW_PUB.seq: * 
/cgn2_6/ptodata/2/pubpna/US06_NEW_PUB. seq: * 
/cgn2_6/ptodata/2/pubpna/US06_PUBCOMB. seq: * 
/cgn2_6/ptodata/2/pubpna/US07_NEW_PUB. seq: * 
/cgn2_6/ptodata/2/pubpna/PCTUS_PUBCOMB.seq: 
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/cgn2_6/ptodata/2/pubpna/US08_PUBCOMB. seq: * 
/cgn2_6/ptodata/2/pubpna/US09A_PUBCOMB.seq: 
/cgn2_6/ptodata/2/pubpna/US09B_PUBCOMB. seq 
/cgn2_6/ptodata/2/pubpna/US09C_PUBCOMB. seq 
/cgn2_6/ptodata/2/pubpna/US09_NEW_PUB.seq: 
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/cgn2_6/ptodata/2/pubpna/US10B_PUBCOMB. seq 
/cgn2_6/ptodata/2/pubpna/US10C_PUBCOMB. seq 
/cgn2_6/ptodata/2/pubpna/US10D_PUBCOMB. seq 
/cgn2_6/ptodata/2/pubpna/US10E_PUBCOMB.seq 
/cgn2_6/ptodata/2/pubpna/US10F_PUBCOMB. seq 
/cgn2_6/ptodata/2/pubpna/US10_NEW_PUB.seq: 
/cgn2_6/ptodata/2/pubpna/USll_NEW_PUB. seq: 
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Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 
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ALIGNMENTS 



RESULT 1 
US-09-918-779-1 



Sequence 1, Application US/09918779 
Publication No. US20030064369A1 
GENERAL INFORMATION: 
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APPLICANT: 
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APPLICANT: 
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; TITLE OF INVENTION: Novel Proteins and Nucleic Acids Encoding Same 

; FILE REFERENCE: 21402-074 US 

; CURRENT APPLICATION NUMBER: US/09/918,779 

; CURRENT FILING DATE: 2001-07-30 

; PRIOR APPLICATION NUMBER: 60/221,409 

; PRIOR FILING DATE: 2000-07-28 

; PRIOR APPLICATION NUMBER: 60/222,840 

; PRIOR FILING DATE: 2000-08-04 

; PRIOR APPLICATION NUMBER: 60/223,752 

; PRIOR FILING DATE: 2000-08-08 

; PRIOR APPLICATION NUMBER: 60/223,762 

; PRIOR FILING DATE: 2000-08-08 

PRIOR APPLICATION NUMBER: 60/223,770 
; PRIOR FILING DATE: 2000-08-08 

PRIOR APPLICATION NUMBER: 60/223,769 
; PRIOR FILING DATE: 2000-08-08 
; PRIOR APPLICATION NUMBER: 60/225,146 
; PRIOR FILING DATE: 2000-08-14 
; PRIOR APPLICATION NUMBER: 60/225,392 
; PRIOR FILING DATE: 2000-08-15 
; PRIOR APPLICATION NUMBER: 60/225,470 
; PRIOR FILING DATE: 2000-08-15 
; PRIOR APPLICATION NUMBER: 60/225,697 
; PRIOR FILING DATE: 2000-08-16 
; PRIOR APPLICATION NUMBER: 60/263,662 
; PRIOR FILING DATE: 2001-02-01 
; PRIOR APPLICATION NUMBER: 60/281,645 
; PRIOR FILING DATE: 2001-04-05 
; NUMBER OF SEQ ID NOS : 61 
; SOFTWARE: Patentln Ver. 2.1 
; SEQ ID NO 1 

LENGTH: 2752 
TYPE: DNA 

ORGANISM: Homo sapiens 
US-09-918-779-1 



Query Match 100.0%; Score 2752; DB 10; Length 2752; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2752; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 



Qy 


l 


CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 


60 






1 M 1 M 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




UD 


1 


^UCjUbGLjbCCLOGubCCCGGCCCGCCCGCCTGCCCGC 


60 


Qy 


61 


GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 


120 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




UD 


ol 


GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 


120 


Qy 


121 


CAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCAC 


180 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




JJD 


IZl 


CAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCAC 


180 


Qy 


181 


TT C CTGGT GGAGC C CGAGGAT GT GT ACAT C GT CAAGAACAAGCCAGTGCT GCTT GT GT GC 


240 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


181 


TTCCTGGTGGAGCCCGAGGATGTGTACATCGTCAAGAACAAGCCAGTGCTGCTTGTGTGC 


240 


Qy 


241 


AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 


300 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 || I I 




Db 


241 


AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 


300 


Qy 


301 


GAC CAC GT GAT CGAGC GCAGCACAGAC GGGAGCAGT GGGCT GC C C ACCAT GGAGGT CCGC 


360 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I I I I I I I I I 




Db 


301 


GAC CAC GT GAT CGAGC GCAGCACAGAC GGGAGCAGT GGGCT GCC CACCATGGAGGT CC GC 


360 


Qy 


361 


ATTAAT GT CT CAAGGCAGCAGGT CGAGAAGGTGTT CGGGCT GGAGGAAT ACT GGT GC C AG 


420 






1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


TCI 

361 


AT T AAT GT CT CAAGGCAGCAGGT C GAGAAGGT GT T C GGGCT GGAGGAAT ACT GGT GCCAG 


420 


Qy 


421 


TGCGT GGCAT GGAGCT C CT C GGGCACCAC CAAGAGT CAGAAGGC CT AC AT C C GCAT AGC C 


480 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 I 1 I I I 




UD 


421 


TGC GTGGCAT GGAGCT C CTCGGGC ACCAC CAAGAGT CAGAAGGCCT ACAT CC GCAT AGC C 


480 


Qy 


481 


AGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGC 


540 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




UD 


481 


AGAT T GC GCAAGAACT T C GAGCAGGAGC CGCT GGC CAAGGAGGT GT CC CT GGAGCAGGGC 


540 


Qy 


541 


ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 


600 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




UD 




ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 


600 


Qy 


601 


AAC GAGGAC CT GGT GGAC CCGT C C CTGGACCCCAAT GT AT AC AT CACGC GGGAGC ACAGC 


660 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


601 


AACGAGGAC CTGGT GGACCCGTCCCTGGACCCCAAT GT AT ACAT CACGCGGGAGCACAGC 


660 


Qy 


661 


CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 


720 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


661 


CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 


720 


Qy 


721 


ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 


780 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


721 


ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCT'GTCATCGTCTACGTGAACGGTGGGTGG 


780 



Qy 781 TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 840 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I ! I I I I I I I I I I I II I 
Db 781 TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 840 

Qy 841 AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 900 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 900 

Qy 901 GT CCAGAAAACAGCCT GCGC C AC C CTGT GCC C AGTAGAC GGCAGCT GGAGCCC GT GGAGC 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 901 GT CCAGAAAACAGC CT GC GCCACCCTGT GC C CAGTAGAC GGCAGCT GGAGC CCGT GGAGC 960 

Qy 961 AAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGACCCA 1020 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 961 AAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGACCCA 1020 

Qy 1021 GCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTGGACACCCGCAACTGTACC 1080 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 GCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTGGACACCCGCAACTGTACC 1080 

Qy 1081 AGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGCCTC 1140 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I 
Db 1081 AGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGCCTC 1140 

Qy 1141 ATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGG 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 ATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGG 1200 

Qy 1201 AAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCACCTCAGGCTTCCAG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 AAGAAGGAGGGGCT GGACT CAGAT GT GGCTGACT CGT C C ATT CT CACCT CAGGCTTC CAG 1260 

Qy 1261 CC CGT CAGCAT CAAGC C CAGCAAAGCAGACAAC C CC C AT CT GCT CAC CAT C CAGCCGGAC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1261 CC CGT CAGCAT C AAGC C CAGCAAAGCAGACAACCCCCAT CT GCT CAC CAT C CAGC C GGAC 1320 

Qy 1321 CT CAGC AC CAC CAC CAC CAC CT ACCAGGGCAGT CT CT GT C CC CGGC AGGAT GGGC CCAGC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1321 CT C AGCAC C ACCAC CAC CAC CT AC CAGGGCAGT CT CT GT C CCCGGC AGGAT GGGCCCAGC 1380 

Qy 1381 CCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACACA 1440 

I I I I I I J I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 CCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACACA 1440 

Qy 1441 CTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACCCAG 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I 
Db 1441 CTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACCCAG 1500 

Qy 1501 AACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGGACCTTCAACTTC 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 AACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGGACCTTCAACTTC 1560 

Qy 1561 CTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCAGATGCC 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 CTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCAGATGCC 1620 

Qy 1621 AT ACCC CGAGGGAAGAT CT AT GAGATCT ACCT C AC GCT GCACAAGC C GGAAGACGT GAGG 1680 



I I I I I I I I I I I I I I I I ! I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 AT AC C CC GAGGGAAGAT CTAT GAGAT CT ACCTC ACGCT GC ACAAGCCGGAAGACGT GAGG 1680 

Qy 1681 TTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCTGGC 1740 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I II I I I I 
Db 1681 TTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCTGGC 1740 

Qy 1741 GTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCTGAC 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 GTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCTGAC 1800 

Qy 1801 AGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCTGCAC 1860 

I I I I I I II I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 1801 AGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCTGCAC 1860 

Qy 1861 CTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTAC 1920 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1861 CTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTAC 1920 

Qy 1921 GTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCC 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 1921 GTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCC 1980 

Qy 1981 GCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAAC 204 0 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1981 GCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAAC 2040 

Qy 2041 AT CCGGGT CT ACT GC CT GCAT GAC ACC CACGAT GCACT CAAGGAGGT GGT GCAGCT GGAG 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2041 AT CCGGGT CT ACT GCCT GCAT GACACC CACGAT GCACT CAAGGAGGT GGT GCAGCT GGAG 2100 

Qy 2101 AAGCAGCT GGGGGGACAGCT GAT CCAGGAGC CAC GGGT CCT GCACT T CAAGGAC AGT T AC 2160 

I I I I- I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 AAGCAGCT GGGGGGACAGCT GAT CCAGGAGCCACGGGTCCTGCACTT CAAGGACAGTTAC 2160 

Qy 2161 C ACAACCT GCGCCT AT C CAT CCAC GAT GTGCCCAGCT C CCT GT GGAAGAGTAAGCT CCTT 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2161 C ACAACCT GCGCCT AT C CAT CCAC GAT GTGCC CAGCT C CCT GT GGAAGAGTAAGCT CCTT 2220 

Qy 2221 GT CAGCTACCAGGAGAT CCCCTTTTATCACATCT GGAATGGCACGCAGCGGT ACTTGCAC 2280 

I I I I I I I I I II II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2221 GT CAGCTACCAGGAGAT CCCCTTT T AT C AC AT CT GGAAT GGCAC GC AGCGGT ACTT GCAC 2280 

Qy 2281 T GCAC CT T CAC C CT GGAGCGT GT C AGC C C C AGC ACT AGT GAC CT GGCCT GCAAGCT GT GG 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 TGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCTGTGG 2340 

Qy 2341 GT GT GGCAGGT GGAGG G C GACGGGCAGAGCTT C AGCAT CAACT T CAACAT CAC CAAGGAC 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 GT GT GGCAGGT GGAGGG C GACGGGCAGAGCTT CAGCAT CAACT T CAACAT CAC CAAGGAC 2400 

Qy 2401 ACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGC 2460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2401 ACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGC 2460 

Qy 2461 C C CAGTGC CTT CAAGAT CCCCTTCCT C ATT CGGCAGAAGAT AAT TT CCAGCCT GGAC C CA 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 2461 CCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGCCTGGACCCA 2520 

Qy 2521 CCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAGCCAT 2580 

I I I I I I I I I 1 I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2521 CCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAGCCAT 2580 

Qy 2581 CT CAGCTT CTT T GC CT C CAAGC CCAGCC C C ACAGC CAT GAT C CT CAAC CT GT GGGAGGC G 2640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2581 CT CAGCTT CTTTGCCTC CAAGC CCAGCC CCACAGCC AT GAT CCTCAACCTGTGGGAGGCG 2640 

Qy 2641 CGGCACTT C C C CAACGGCAAC CT CAGC CAGCT GGCT GCAGCAGT GGCT GGACT GGGCCAG 2700 

I I I I I I I I I I I I I II I I I I I I II I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 2641 CGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGGCCAG 2700 

Qy 2701 CCAGACGCT GGCCT CT T CACAGT GT CGGAGGCTGAGT GCTGAGGC C GGC CAG 2752 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2701 CCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGCCGGCCAG 2752 



RESULT 2 
US-10-624-932-1 

; Sequence 1, Application US/10624932 
; Publication No. US20040096877A1 
; GENERAL INFORMATION: 
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Qy 1 CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 60 

Qy 61 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 120 

Qy 121 CAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCAC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I 
Db 121 CAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCAC 180 

Qy 181 TT CCT GGT GGAGC CC GAGGAT GT GT ACAT C GTCAAGAACAAGC CAGT GCT GCTT GT GT GC 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 T T CCT GGT GGAGC C C GAGGAT GT GT ACAT C GTCAAGAACAAGC CAGT GCT GCTT GT GT GC 240 

Qy 241 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 300 

III II till II I II I III I I I I I I I I I I I II I I III I I I I I III I I I I I I I I I I I I III I 
Db 241 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 300 

Qy 301 GAC CAC GT GAT C GAGCGC AGCACAGACGGGAGC AGT GGGCT GCCCACCAT GGAGGT C C GC 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db ... 301 GAC C ACGT GAT C GAGCGCAGCACAGAC GGGAGC AGT GGGCT GCCCAC CAT GGAGGT CCGC 360 

Qy 361 ATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTC GGGCT GGAGGAAT ACT GGT GCCAG 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 ATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTC GGGCT GGAGGAATACT GGT GCCAG 420 

'Qy 421 T GCGTGGCAT GGAGCTCCT CGGGCACCACCAAGAGTCAGAAGGCCTACATCCGCATAGCC 480 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I II I I I I I I I I I II I I 
Db 421 T GC GT GGCAT GGAGCTC CT CGGGCAC CAC CAAGAGT C AGAAGGCCT AC AT C CGCAT AGC C 480 

Qy 481 AGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 481 AGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGC 540 

Qy 541 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 600 

Qy 601 AAC GAGGAC CT GGT GGAC C CGT CC CT GGAC C C CAAT GT ATACAT CAC GC GGGAGCACAGC 660 

I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I 1 I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 601 AAC GAGGACCT GGT GGAC C C GT CC CT GGAC C C CAAT GT ATACAT CAC GC GGGAGCACAGC 660 

Qy 661 CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 720 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 661 CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 720 

Qy 721 ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 780 

Qy 781 TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 840 

Qy 841 AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 900 

Qy 901 GT CCAGAAAACAGCCT GCGC CAC C CT GT GCC CAGTAGAC GGCAGCTGGAGC CC GTGGAGC 960 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 901 GT C CAGAAAACAGCCT GCGC CAC C CT GT GCC CAGT AGACGGC AGCTGGAGC CC GT GGAGC 960 

Qy 961 AAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGACCCA 1020 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I 
Db 961 AAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGACCCA 1020 

Qy 1021 GCAC CCCGCAAC GGAGGGGAGGAGT GC C AGGGCACT GAC CT GGAC ACC CGCAACT GT AC C 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 GCAC CC CGCAAC GGAGGGGAGGAGT GCCAGGGCACT GAC CT GGACAC CCGCAACTGT AC C 108 0 

Qy 1081 AGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGCCTC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 AGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGCCTC 1140 

Qy 1141 ATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGG 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 1141 ATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGG 1200 

Qy 1201 AAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCACCTCAGGCTTCCAG 1260 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 AAGAAGGAGGGGCTGGACT CAGAT GTGGCT GACT C GT CC ATT CT C AC CT CAGGCTT C CAG 1260 

Qy 1261 C CCGTC AGC ATCAAGC CC AGCAAAGC AGACAACCC C CAT CT GCT CAC CAT CCAGCC GGAC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1261 C CCGTC AGC ATCAAGC C CAGCAAAGC AGACAAC CC CC AT CT GCT CAC CAT CCAGCC GGAC 1320 

Qy 1321 CTCAGC ACC ACCACC ACC ACCT AC CAGGGCAGT CT CT GT C C C CGGC AGGAT GGGC CCAGC 1380 

II I I I I I I I I I I I I I I II I II I I I I I I I I II I ill I I I I I II I I I II I I I I I I I I I I I I I 

Db 1321 CTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAGGATGGGCCCAGC 1380 



Qy 

Db 



1381 
1381 



CCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACACA 
I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I 
CCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACACA 



1440 
1440 



Qy 1441 CTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACCCAG 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 CTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACCCAG 1500 

Qy 1501 AACT ACTT CC GCT C C CT GCC CCGAGGCACCAGCAACAT GAC CT AT GGGAC CTT CAACTT C 1560 

I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 AACT ACTT C C GCT CCCT GCC C CGAGGCACC AGCAAC AT GAC CTAT GGGACCTT CAACTT C 1560 

Qy 1561 CTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCAGATGCC 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 CTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCAGATGCC 1620 

Qy 1621 ATACCCC GAGGGAAGATCTATGAGATCTACCTCACGCTGCACAAGCCGGAAGACGT GAGG 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 AT AC CC C GAGGGAAGAT CTAT GAGAT CT ACCT C AC GCT GC ACAAGCC GGAAGAC GT GAGG 1680 

Qy 1681 TTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCTGGC 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 TTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCTGGC 1740 

Qy 1741 GTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCTGAC 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 GTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCTGAC 1800 

Qy 1801 AGCT GGAGCCT GC GC CT CAAAAAGCAGT CGT GC GAGGGCAGCT GGGAGGAT GT GCT GCAC 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db . 1801 AGCT GGAGCCTGCGC CT CAAAAAGCAGT CGT GCGAGGGCAGCTGGGAGGATGTGCTGCAC 1860 

Qy 1861 CTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTAC 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 1861 CTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTAC 1920 

Qy 1921 GTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCC 1980 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1921 GTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCC 1980 

Qy 1981 GCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAAC 2040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1981 GCCAAGCGCCTCAAGCT GCT TCTGTTTGCGCCGGTGGCCT GCAC CTCCCTCGAGTACAAC 2040 

Qy 2041 ATCCGGGTCTACTGCCTGCATGACACCCACGATGCACTCAAGGAGGTGGTGCAGCTGGAG 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2041 AT CC G GGT CT ACT GC CT GCAT GAC ACC C AC GAT GC ACT CAAGGAG GT GGT GCAGCT GGAG 2100 

Qy 2101 AAGCAGCT GGGGGGACAGCT GAT C C AGGAGC CACGGGT CCT GCACT T CAAGGAC AGT TAC 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 AAGCAGCT GGGGGGACAGCT GAT C C AGGAGC CACGGGT CCT GCACT T CAAGGACAGT TAC 2160 

Qy 2161 C ACAACCT GCGC CT ATC C AT C CAC GAT GTGCCC AGCT CCCT GT GGAAGAGTAAGCT C CT T 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 CACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGGAAGAGTAAGCTCCTT 2220 



Qy 2221 GTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACGCAGCGGTACTTGCAC 2280 

1 I I I I I I I I I 1 I I I I I I I I I I I 1 I I I I I I I I I I I I 1 I 1 I I I I I I f I I I I f t I I I 1 I 1 I 1 I 
Db 2221 GT CAGCT ACCAGGAGATCC CCT TTT AT CAC AT CTGGAAT GGCAC GCAGCGGT ACTTGCAC 2280 

Qy 2281 TGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCTGTGG 2340 

I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2281 T GCAC CTT CAC C CT GGAGC GT GT CAGC C C CAGCACT AGT GACCT GGCCT GCAAGCT GT GG 2340 

Qy 2341 GT GT GGC AGGT GGAGGGCGACGGGCAGAGCTT CAGC AT CAACTT CAACAT CACCAAGGAC 2400 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2341 GT GT GGCAGGT GGAGGGCGACGGGCAGAGCTT CAGCAT CAACTT CAACAT CACCAAGGAC 2400 

Qy 2401 ACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGC 2460 

I I I I I I I I I I I I I I I I I I II I I II I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 24 01 ACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGC 2460 

Qy 2461 CC C AGTGC CTT CAAGAT CCCCTTC CT CAT T CGGC AGAAGATAATTT CCAGC CT GGACCCA 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2461 CCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGCCTGGACCCA 2520 

Qy 2521 CC CT GT AGGC GGGGT GCC GACT GGCGGACT CT GGCC CAGAAACT CCACCT GGACAGC CAT 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 2521 CCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAGCCAT 2580 

Qy 2581 CTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGGGAGGCG 2640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2581 CT CAGCT TCTTTGCCTCCAAGCCCAGCCCCACAGC CAT GAT CCT CAACCTGTGGGAGGCG 2640 

Qy 2641 CGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGGCCAG 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2641 CGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGGCCAG 2700 

Qy 2701 CCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGCCGGCCAG 2752 

I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2701 C C AGAC GCTGGC CT CT T CACAGT GT C GGAGGCT GAGT GCT GAGGCC GGCCAG 2752 
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Query Match 97.3%; Score 2676.4; DB 10; Length 2881; 

Best Local Similarity 98.9%; Pred. No. 0; 

Matches 2728; Conservative 0; Mismatches 21; Indels 9; Gaps 3; 



Qy 1 CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 42 CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 101 

Qy 61 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 120 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 102 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 161 

Qy 121 CAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCAC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 162 CAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCAC 221 

Qy 181 TTCCTGGTGGAGCCCGAGGATGTGTACATCGTCAAGAACAAGCCAGTGCTGCTTGTGTGC 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 222 TT C CT GGTGGAGC CC GAGGAT GT GT ACAT CGT CAAGAACAAGC CAGT GCT GCTT GT GT GC 281 

Qy 241 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 282 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 341 

Qy 301 GACCACGTGATCGAGCGCAGCACAGACGGGAGCAGTGGGCTGCCCACCATGGAGGTCCGC 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I II I I I I I I I I I II 
Db 342 GACCACGTGATCGAGCGCAGCACAGACGGGAGCAGT GGTGAGCCGACCAT GGAGGTCCGC 401 

Qy 361 AT T AAT GTCT CAAGGCAGCAGGT C GAGAAGGT GT T C GGGCT GGAGGAATACT GGT GCCAG 420 

I I I I I I I I I I I I I I I I I I I I I I M II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 402 ATTAATGT CT CAAGGCAGCAGGT C GAGAAGGT GTT C GGGCT GGAGGAATACT GGT GC CAG 461 

Qy 421 T GCGT GGCAT GGAGCT C CT C GGGCAC CACCAAGAGT CAGAAGGCCT ACAT CCGCATAGCC 4 80 

I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 462 T GCGTGGCAT GGAGCT C CT C GGGCAC CAC CAAGAGT C AGAAGGC CT ACAT CC GCATAGCC 521 

Qy 481 AGATTGCGCAAGAACTT C GAGC AGGAGCCGCT GGC CAAGGAGGTGT CC CT GGAGCAGGGC 540 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 522 AGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGC 581 

Qy 541 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 600 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 582 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 641 

Qy 601 AACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATCACGCGGGAGCACAGC 660 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 642 AAC GAGGACCT GGT GGACCCGT C C CT GGAC CC CAAT GT AT ACAT CAC GCGGGAGCACAGC 701 

Qy 661 CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 702 CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 761 

Qy 721 ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 780 



Db 
Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



762 



781 



I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I | | | | | || | | | | | I I | | | | | | | | | | | | | 

ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 



821 



840 



TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 
I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
822 TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 881 



841 



882 



901 



942 



958 



AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 



900 



941 



957 



GTCCAGAA AACAGCCTGCGCCACCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGG 

I I M I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

GTCCATGACCGCACCGTCTCCTCTCTGCTTGTCTCTGTGGACGGCAGCTGGAGCCCGTGG 1001 



AGCAAGT GGT C GGC CT GT GGGCTGGACT GCACC CACTGGCGGAGCC GT GAGT GCT CTGAC 1017 

I 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II I 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 

1002 AGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGAC 1061 

1018 CCAGCACC CCGCAAC GGAGGGGAGGAGT GCCAGGGCACTGACCT GGACACC C GCAACT GT 1077 

I I M I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
1062 CCAGCACC C CGCAAC GGAGGGGAGGAGT GC CAGGGCACT GAC CT GGACAC CC GCAACT GT 1121 

1078 ACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGC 1137 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1122 ACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGC 1181 

1138 CTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGC 1197 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1182 CTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGC 1241 

1198 CGGAAGAAGGAGGGGCTGGACT CAGAT GT GGCTGACTCGT CCATTCTCACCTCAGGCTT C 1257 

M I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1242 CGGAAGAAGGAGGGGCT GGACT CAGAT GT GGCT GACT CGT C CAT T CTCACCT CAGGCTT C 1301 

1258 CAGCCCGT CAGCAT CAAGCC CAGCAAAGCAGACAACCCC CAT CTGCTCACCAT CCAGCC G 1317 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1302 CAGCCC GT CAGCAT CAAGC C CAGCAAAGCAGACAACCCC CAT CT GCT CAC CAT C CAGC CG 1361 

1318 GACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAGGATGGGCCC 1377 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1362 GACCTCAG CAC CAC CACC ACCT AC CAGGGCAGT CT CT GT C CCCGGC AGGAT GGGC C C 1418 

1378 AGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCAC 1437 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
1419 AGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCAC 1478 

1438 ACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACC 1497 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1479 ACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACC 



1498 CAGAACT ACTT C CGCTC C CT GC C CC GAGGCACC AGCAACATGACCT AT GGGAC CTT CAAC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1539 CAGAACTACTT CC GCT C C CT GCC C C GAGGCACC AGCAACAT GAC CT AT GGGAC CT T CAAC 



1538 



1557 



1598 



1558 TTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCAGAT 1617 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 



1599 TTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCAGAT 1658 

1618 GC CAT AC CCC GAGGGAAGAT CT AT GAGATCT AC CT CACGCT GC ACAAGC CGGAAGACGT G 1677 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1659 GC CAT ACCCC GAGGGAAGAT CT AT GAGATCT AC CT CACGCT GCACAAGCC GGAAGACGT G 1718 

167 8 AGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCT 1737 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I) I I I I I I I I I I I I I I I I I I I I I I 
1719 AGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCT 177 8 

1738 GGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCT 1797 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1779 GGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCT 1838 

1798 GACAGCT GGAGC CT GCGCCT CAAAAAGCAGT CGT GC GAGGGCAGCT GGG AGGATGTG 1854 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 1 I I I I I I I I I I I I I I I I I I I I 
1839 GACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGCAGGATGTG 1898 

1855 CTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCC 1914 

I I I II I I I I I I I I I I I I 1 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1899 CTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCC 



1958 



1915 



TGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTG 1974 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1959 TGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTG 2018 

1975 GCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAG 2034 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
2019 GCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAG 2078 

2035 T ACAAC AT C C GGGT CTACT GCCT GCAT GAC ACC CAC GATGCACT CAAGGAGGT GGT GC AG 2094 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
2079 TACAACAT CCGGGTCTACTGCCTGCAT GACACCCACGATGCACT CAAGGAGGT GGT GCAG 



2095 CT GGAGAAGCAGCT GGGGGGACAGCT GATC CAGGAGC C ACGGGT CCT GCACT T CAAGGAC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2139 CT GGAGAAGCAGCT GGGGGGACAGCT GATC CAGGAGC CAC GGGT CCT GCACT T CAAGGAC 

2155 AGTT AC CACAAC CT GCGCCT AT CCAT CCAC GAT GT GC C CAGCT CCCT GT GGAAGAGTAAG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
2199 AGTT AC CACAAC CT GCGCCT AT CCATCCAC GAT GT GCCCAGCT CCCT GT GGAAGAGTAAG 

2215 CT CCT T GT CAGCT AC CAGGAGAT C C CCTTTT AT CACAT CT GGAAT GGCAC GCAGCGGT AC 

I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CT CCTT GT CAGCT AC CAGGAGAT CC CCTTTT AT CACAT CT GGAAT GGCACGCAGCGGT AC 



2259 



2275 



2319 



2335 



2138 



2154 



2198 



2214 



2258 



2274 



2318 



2334 



TT GCACT GCAC CTT CAC CCT GGAGC GT GTCAGC C C C AGCACT AGT GAC CT GGC CT GCAAG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAG 2378 



2394 



CT GT GGGT GT GGCAGGT GGAGGGCGAC GGGCAGAGCT T C AGCAT CAACTT CAACAT CAC C 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2379 CT GT GGGT GT GGCAGGT GGAGGGC GAC GGGCAGAGCT T CAGCAT CAACTT CAACAT CACC 2438 

2395 AAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTG 2454 

I II I I I III II I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I 
2439 AAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTG 24 98 



Qy 

Db 



2455 GTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGCCTG 2514 

I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2499 GTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGCCTG 2558 



Qy 2515 GACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGAC 2574 

M I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I II 
Db 2559 GACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGAC 2618 

Qy 2575 AGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGG 2634 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2619 AGCCAT CTC AGCTT CTTT GCCT CCAAGCCCAGCC C CACAGCCATGAT C CTCAACCT GT GG 2678 

Qy 2635 GAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTG 2694 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2679 GAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTG 2738 

Qy 2695 GGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGCCGGCCAG 2752 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2739 GGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGCCGGCCAG 2796 
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Query Match 85.6%; Score 2356; DB 18; Length 3561; 

Best Local Similarity 93.6%; Pred. No. 0; 

Matches 2537; Conservative 0; Mismatches 5; Indels 168; Gaps 1; 

Qy 43 GCCATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGG 102 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 GCCATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGG 60 

Qy 103 CTCCGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAAC 162 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 61 CTCCGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAAC 120 

Qy 163 C CGGACCT GCTT C C CCACTT C CT GGT GGAGC CC GAGGAT GTGT AC AT C GT CAAGAACAAG 222 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 121 C CGGACCT GCTT C CC CACTT CCT GGT GGAGC CCGAGGATGTGTACAT C GT CAAGAACAAG 180 

Qy 223 C C AGT GCT GCTT GT GT GCAAGGC C GT GC CC GCCACGCAGATCTTCTT CAAGT GCAACGGG 282 

I II I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 181 CCAGTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGG 240 

Qy 283 GAGT GGGT GC GCCAGGT GGAC CACGT GAT C GAGC GCAGCACAGACGGGAGC AGT GGGCT G 342 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 GAGT GGGTGC GCCAGGT GGACCACGT GAT C GAGC GCAGCACAGACGGGAGC AGT GGGCT G 300 

Qy 343 CCCACCATGGAGGTCCGCATTAATGT CT CAAGGCAGCAGGTCGAGAAGGT GTT CGGGCTG 402 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 C C C ACCATGGAGGT CCGCATTAAT GT CT C AAGGCAGCAGGTC GAGAAGGT GTT C GGGCT G 360 

Qy 403 GAGGAATACT GGTGCCAGTGCGT GGCAT GGAGCT CCTCGGGCACCACCAAGAGT CAGAAG 4 62 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 GAGGAATACT GGT GCCAGTGCGT GGCAT GGAGCT CCTCGGGCACCACCAAGAGT CAGAAG 420 

Qy 463 GC CT ACATCC GC AT AGC CAGATT GCGCAAGAACT T C GAGCAGGAGCCGCT GGC CAAGGAG 522 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 GC CTACATCCGCAT AGC CTATTT GCGCAAGAACT T C GAGCAGGAGCCGCT GGCCAAGGAG 480 

Qy 523 GTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCC 582 

II I III I I II I II I III II III I I I I I I I I I I I I I I I I I I I I I I I I I I I III III II III 

Db 481 GTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCC 540 

Qy 583 GAGGT GGAGT GGCT C CGGAAC GAGGAC CT GGT GGACCCGT CCCTGGACCC CAAT GT ATAC 642 

I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 GAGGT GGAGT GGCT C CGGAAC GAG GAC CT GGT GGAC CCGT C C CT GGACCC CAAT GT ATAC 600 

Qy 643 ATCACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTAC 702 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 AT C AC GCGGGAGCACAGC CT GGT GGT G C GACAGGC CC GC CTT GCT GACAC GGC CAACT AC 660 

Qy 703 ACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTC 762 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 ACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTC 720 

Qy 763 TACGTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGG 822 

I I I I I I 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 



721 TACGTG 726 

823 CGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCT 882 

727 726 

883 T T CT GT GAGGGGCAGAAT GT CC AGAAAACAGCCT GC GCCACCCT GT GCCCAGT AGAC GGC 942 

I I I I I I 

727 GACGGC 732 

9.43 AGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGC 1002 

I I I I I I I I I I I 1 I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
733 AGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGC 792 

1003 C GT GAGT GCT CT GACCCAGCACCCC GCAACGGAGGGGAGGAGTGCCAGGGCACT GACCTG 1062 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I 
793 CGT GAGT GCTCT GAC CCAGCACC CCGCAACGGAGGGGAGGAGTGC CAGGGCACTGAC CT G 852 

1063 GACACC C GCAACT GT ACCAGT GAC CT CT GT GT ACACAGT GCTTCT GGCC CT GAGGAC GT G 1122 

I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I 
GACACC C GCAACT GT ACCAGT GACCT CT GT GTACACACT GCTTCT GGCCCT GAGGACGT G 912 



853 



1123 



913 



GCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTC 1182 
I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
GCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTC 



1183 ATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
973 AT CCTC GTTT AT T GC CGGAAGAAGGAGGGGCT GGACTCAGAT GT GGCTGACT C GT CC ATT 



1243 



972 



1242 



1032 



CTCACCTCAGGCTTCCAGCCCGTCAGCATCAAGCCCAGCAAAGCAGACAACCCCCATCTG 1302 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

1033 CT CACCT C AGGCTT CCAGCCCGT C AGC AT CAAGC C CAGCAAAGCAGACAAC CC C CAT CT G 1092 



1303 CTCACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCC 
I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1093 CTCACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCC 



1363 



1153 



1423 



CGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTG 



GGT GGC GGC C GC C ACACACT GC AC CACAGCT CT C C CACCT CT GAGGC CGAGGAGTT CGTC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
1213 GGT GGC GGC CGC CACACACT GCAC CACAGCT CT C C CACCT CT GAGGC CGAGGAGTT C GTC 

14 83 TCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
1273 TCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACC 

1543 TAT GGGAC CT T CAACTT C CT CGGGGGCCGGCT GAT GAT C C CT AAT ACAGGT AT CAGC CT C 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1333 TAT GGGAC CT T CAACTT C CT CGGGGGCCGGCTGAT GAT C C CT AAT AC AGGAAT CAGC CT C 

1603 CT CAT CC C C CCAGAT GC CAT ACCC C GAGGGAAGAT CT AT GAGAT CT AC CT CACGCT GCAC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
1393 CT CATC C C C C C AGAT GCCAT ACCC C GAGGGAAGAT CT AT GAGAT CT AC CT CACGCT GCAC 



1362 



1152 



1422 



1212 



1482 



1272 



1542 



1332 



1602 



1392 



1662 



1452 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1663 AAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTT 1722 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1453 AAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTT 1512 

1723 AGCTGTGGAGCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGT 1782 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1513 AGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGT 1572 

1783 GGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGC 1842 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGC 



1573 



1632 



1843 TGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTG 1902 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I. 
TGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTG 



1633 



1692 



1962 



1903 GAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1693 GAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAG 1752 



1963 



2022 



GCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I 
1753 GCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGC 1812 

2023 AC CT CCCTCGAGT ACAACAT C C GGGT CT ACT GC CT GC AT GACACC CACGAT GCAC T CAAG 2082 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1813 ACCTCCCTCGAGTACAACATCCGGGT CTACTGCCT GCAT GACACC CACGAT GCACTCAAG 1872 

2083 GAGGT GGTGCAGCT GGAGAAGCAGCT GGGGGGAC AGCT GATCCAGGAGC CACGGGT C CT G 2142 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
1873 GAGGT GGTGCAGCT GGAGAAGCAGCT GGGGGGACAGCT GATCCAGGAGC CAC GGGT C CT G 1932 

2143 CACTT CAAGGACAGT T ACCACAACCT GCGCCTAT C CAT CCACGAT GT GC C CAGCT C C CT G 22 02 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CACTT CAAGGACAGT T ACCACAACCT GCGCCTAT CCAT CCACGATGTGCCCAGCT CCCTG 



1933 



1992 



2203 T GGAAGAGTAAGCT C CTT GT CAGCT AC CAGGAGAT C CC CTTTT AT CACAT CT GGAAT GGC 2262 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
T GGAAGAGTAAGCT C CTT GT CAGCT AC CAGGAGAT C C C CTTTT AT CACAT CT GGAAT GGC 



1993 



2263 



2052 



ACGCAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGAC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2053 ACGCAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGAC 



2323 



2113 



2383 



CTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAAC 
I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAAC 



TT CAACATCACCAAGGACACAAGGTTTGCT GAGCT GCTGGCTCT GGAGAGTGAAGCGGGG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2173 TT CAAC ATCAC CAAGGAC ACAAGGTTT GCT GAGCT GCT GGCTCT GGAGAGT GAAGCGGGG 



2322 



2112 



2382 



2172 



2442 



2232 



2443 GTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATA 2502 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2233 GTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATA 2292 



Qy 

Db 



2503 
2293 



ATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAA 2562 
I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAA 2352 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 



2563 CTC CAC CTGGACAGC CATCT CAGCTT CTTT GCCTCCAAGCC C AGCCC C ACAGCCAT GAT C 2622 

I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I i I 
2353 CTCCACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATC 2412 

2623 CTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCA 2682 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2413 CTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCA 2472 



2683 



2473 



2743 



2533 



GTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2742 
I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2532 



2752 



GGCCGGCCAG 
I I I I I I I I I I 
GGCCGGCCAG 2542 
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FEATURE : 

NAME /KEY: misc_f eature 

OTHER INFORMATION: Incyte ID No. US20040023244A1 6052371CB1 
US-10-311-623-13 

Query Match 85.6%; Score 2356; DB 17; Length 3580; 

Best Local Similarity 93.6%; Pred. No. 0; 

Matches 2537; Conservative 0; Mismatches 5; Indels 168; Gaps 1; 

Qy 43 GCCATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGG 102 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 1 GCCATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGG 60 

Qy 103 CTCCGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAAC 162 

I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I 
Db 61 CTCCGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAAC 120 

Qy 163 CCGGACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATGTGTACATCGTCAAGAACAAG 222 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I M I I I I I I I I I I 
Db 121 CCGGACCTGCTT C CCCACTT CCT GGT GGAGCCCGAGGAT GTGTACAT CGT CAAGAACAAG 180 

Qy 223 CCAGTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGG 282 

I I I I I II I I I I I II II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I 
Db 181 CCAGTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGG 240 

Qy 283 GAGT GGGT GCGC CAGGT GGAC CAC GT GAT C GAGCGCAGCAC AGAC GGGAGCAGT GGGCTG 342 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 GAGT GGGT GCGC CAGGT GGAC CAC GT GAT C GAGCGCAGCAC AGAC GGGAGCAGTGGGCTG 300 

Qy 343 CCC ACC AT GGAGGT CCGCATTAAT GT CT CAAGGCAGCAGGT CGAGAAGGT GTT CGGGCTG 402 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 CCCACCATGGAGGTCCGCATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCTG 360 

Qy 4 03 GAGGAAT ACT GGT GCCAGT GC GT GGCAT GGAGCT C CT C GGGC AC CAC CAAGAGT CAGAAG 462 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 GAGGAAT ACTGGTGCCAGTGCGTGGCAT GGAGCT CCT CGGGCACCACCAAGAGTCAGAAG 420 

Qy 463 GC CT ACAT C CGCAT AGC CAGATT GC GCAAGAACT T C GAGCAGGAGCC GCT GGCCAAGGAG 522 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 GCCT ACAT C C GCAT AGCCT ATTT GC GCAAGAACTT CGAGCAGGAGCC GCT GGC CAAGGAG 480 

Qy 523 GTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCC 582 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 r 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 481 GTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCC 540 

Qy 583 GAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATAC 642 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 GAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATAC 600 

Qy 64 3 ATCACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTAC 702 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 ATCACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTAC 660 



Qy 

Db 



703 
661 



762 



720 



Qy 763 TACGTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGG 822 

I I I I I I 

Db 721 TACGTG 726 

Qy 823 CGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCT 882 

Db 727 726 

Qy 883 TT CT GT GAGGGGCAGAAT GT CC AGAAAACAGCCT GCGC C AC C CT GT GC CCAGT AGAC GGC 942 

I I I I I I 

Db 727 GACGGC 732 

Qy 943 AGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGC 1002 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I 
Db 733 AGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGC 792 

Qy 1003 CGTGAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTG 1062 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I 
Db 793 CGT GAGT GCT CT GAC CCAGCACC C C GCAACGGAGGGGAGGAGT GC CAGGGCACTGAC CT G 852 

Qy 1063 GACAC C CGCAACT GT ACCAGT GAC CT CT GT GT ACACAGT GCTT CT GGCCCT GAGGAC GT G 1122 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 853 GACACC C GCAACT GT ACCAGT GACCTCT GT GT ACACACT GCTT CT GGCCCT GAGGAC GT G 912 

Qy 1123 GCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTC 1182 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 913 GCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTC 972 

Qy 1183 AT CCT C GTTT ATT GCC GGAAGAAGGAGGGGCT GGACT C AGAT GT GGCT GACT C GT C C ATT 1242 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 973 AT C CT C GTTT ATT GCC GGAAGAAGGAGGGGCT GGACT C AGAT GT GGCT GACT CGT C C ATT 1032 

Qy 1243 CT C AC CT C AGGCTT CC AGCCC GT CAGC ATCAAGCC C AGCAAAGCAGACAAC C C CCAT CT G 1302 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1033 CT CACCT CAGGCTT CCAGCCCGTCAGCATCAAGCCCAGCAAAGCAGACAACCCCCAT CT G 1092 

Qy 1303 CTCACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCC 1362 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1093 CTCACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCC 1152 

Qy 1363 CGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTG 1422 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 1153 CGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTG 1212 

Qy 1423 GGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTC 14 82 

I I I I I I I I I I I I I I I I I I I I I I I I I I l-U I I I I I I I I I I I I I II I I I I I I I I I I I I II I I 
Db 1213 GGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTC 1272 

Qy 1483 TCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACC 1542 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1273 TCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACC 1332 

Qy 1543 TATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTC 1602 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I II I I I I I II I I I 
Db 1333 TAT GGGACCTTCAACTTCCTCGGGGGCCGGCT GAT GAT CCCTAATACAGGAAT CAGC CTC 1392 

Qy 1603 CT C ATC C CCC C AGATGCCAT ACCCC GAGGGAAGAT CT AT GAGAT CT ACCTCAC GCT GCAC 1662 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 



Db 


1393 


CTCATCCCCCCAGATGCCATACCCCGAGGGAAGATrTATfiAnATrTArrTrArnrTf^rar 


1 /[to 

X *i JZ 


Qy 


1663 


AAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTT 


1722 






1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1453 


AAGCCGGAAGACGTGAGGTTGCCCrTAGrTGGfTf^TrAfiArrrTnrTnAnTrrrATrnTT 


1 SI 9 


Qy 


1723 


AGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGT 


1782 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1513 


AGCTGTGGACCCrrTGGrGTrr , TGrTrArrrGr;rrAr;TrATrrTnr:rTaTr:r;arr3ApTf^T 


1 S79 


Qy 


1783 


GGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGC 


1842 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1573 


Pr^iftfi A CZCC P A P p pt ma p a t pn a pp pt pp pp pt p a a a a a c r* a pt cr^rms.mrms.nr* 




Qy 


1843 


TGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTG 


1902 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1633 


TGGGAGGATGTGCTGCACCTGGGPGAGGAPJ^P^PPPTPPPAPPTPTAPTAPTr^PParzPTa 


1 £Q9 
X Z 


Qy 


' 1903 


GAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAG 


1962 






1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


j. <j _/ — > 


f^A^rrACTrirrT^r ,, rArfZTrTTr , Zir , rrarrarr r rr , rrrrrr'TTTrppr ,, T , rr r prrrarnr 

Or\oov^U/vj x uL-L- X oU 1 nk/bl 1 V^-rYU k^JAKj 1 VjovjL»L»*jL» 111 LjUL^L- 1 1 ooo/\o/\o 


1 / DZ 


Qy 


1963 


GCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGC 


2022 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1753 




XoXZ 


Qy 


2023 


ACCTCCCTCGAGTACAACATCCGGGTCTACTGCCTGCATGACACCCACGATGCACTCAAG 


2082 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1813 




1 QTO 

lo / Z 


Qy 


2083 


GAGGTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTG 


2142 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


x u / o 


X i laU/voU l o b/\brtrt.bL/ib U 1 oooovjoAU/ioC 1 vj/\1 L.bAbbAbl-l.AL.bbb 1 \-L. 1 (j 


±y oz 


Qy 


2143 


CACTTCAAGGACAGTTACCACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTG 


2202 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1933 


rAr , TTrAAn^ArA^TTArrArAAr'r , r^rr!rrTATrpA r rprarraTrTr'pr i rarr r rppp r rr 


x y y z 


Qy 


2203 


TGGAAGAGTAAGCTCCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGC 


2262 






1 1 1 III 1 II II 1 1 1 1 1 1 II II II II II III 1 1 1 1 1 1 1 1 II 1 I I 1 1 I I II I I I | | | | || | | 




Db 


1993 


TPxPxAAPAGTAAPPTPPTTPTPAPPTAPPaPPaPaTPPPPTTTTaTPapaTPTPPanTPPP 


ZUDZ 


Qy 


2263 


ACGCAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGAC 


2322 






1 1 1 1 .1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




.Db 


2053 


ArGrARrKriTArTTRrArTnrArrTTrArrrT^CA^r^TriTrAfzrrppAprarTarT'rar 


9 119 
Z X LZ 


Qy 


2323 


CTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAAC 


2382 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2113 


CTGGCCTGCAAGCTGTGGGTGTGGPAPP.TPTprAPPPPPAPPPPPAPAPPTTPAPPaTPaaP 


9179 
Zl / Z 


Qy 


2383 


TT CAAC AT C ACCAAGGACACAAGGTTT GCT GAGCT GCTGGCT CT GGAGAGT GAAGC GGGG 


2442 






1 1 1 1 1 1 II II 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 I 1 I I I 




Db 


2173 


TTCAACATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGG 


2232 


Qy 


2443 


GTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATA 


2502 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 



Db 2233 GTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATA 2292 

Qy 2503 ATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAA 2562 

I I I I I I I I I I I I II I I I I I I I I I i I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 2293 ATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAA 2352 

Qy 2563 CT CCACCT GGACAGCCAT CT CAGCTTCTTT GCCT C CAAGCC CAGCCC CACAGCCAT GATC 2622 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2353 CTCCACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATC 2412 

Qy 2623 CTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCA 2682 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I II I I I II I I I I I I I I I I I I I I I I 
Db 2413 CTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCA 2472 

Qy 2683 GTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2742 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2473 GTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2532 

Qy 2743 GGCCGGCCAG 2752 

I I I I I I I I I I 
Db 2533 GGCCGGCCAG 2542 
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REFERENCE/ DOCKET NUMBER: UC96-217 
TELECOMMUNICATION INFORMATION: 
TELEPHONE: (415) 343-4341 
TELEFAX: (415) 343-4342 
INFORMATION FOR SEQ ID NO: 1: 
SEQUENCE CHARACTERISTICS: 

LENGTH: 3014 base pairs 
TYPE: nucleic acid 
STRANDEDNESS: double 
TOPOLOGY: linear 
MOLECULE TYPE: cDNA 

SEQUENCE DESCRIPTION: SEQ ID NO: 1: 
US-09-933-261-1 

Query Match 82.1%; Score 2259; DB 10; Length 3014; 

Best Local Similarity 89.7%; Pred. No. 0; 

Matches 2427; Conservative 0; Mismatches 280; Indels 0; Gaps 0; 

Qy 46 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 105 

I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGTGCTCCTGGGCATAGTCCTCGCCGCCTGGCTT 60 

Qy 106 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 165 

II II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 61 CGTGGTTCGGGTGCCCAGCAGAGTGCCACGGTGGCCAATCCAGTGCCCGGTGCCAACCCC 120 

Qy 166 GACCT GCT T CC C CACTTCCT GGT GGAGCCC GAGGAT GT GTACATCGT CAAGAAC AAGCCA 225 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 GACCT GCT GC CCCACT T C CT GGT AGAGCCT GAGGAC GT GTACATT GT CAAGAACAAGCCG 180 

Qy 226 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 285 

Ml M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 GTGTTGTTGGTGTGCAAGGCTGTGCCTGCCACCCAGATCTTCTTCAAGTGCAATGGGGAA 240 

Qy 286 TGGGTGCGCCAGGTGGACCACGTGATCGAGCGCAGCACAGACGGGAGCAGTGGGCTGCCC 34 5 

Mill I I I I I I II II I I I I I II II I I II II I I III I I I I II II MM 
Db 241 T GGGT CCGCC AGGT CGATCACGTAATTGAACGCAGC AC CGACAGCAGCAGC GGATT GCCA 300 

Qy 346 AC CAT GGAGGT C CGCATT AAT GT CT CAAGGCAGCAGGT C GAGAAGGT GTT C GGGCT GGAG 405 

I II I I I II I I II I I II II II II I I II I I I I I II I I I II I I I I I I I I II I I I I 
Db 301 AC CAT GGAGGT CCGT AT CAAC GT AT CGAGGCAGCAGGT AGAGAAAGT GTT T GGGCT GGAG 360 

Qy 406 GAAT ACT GGT GCCAGT GCGT GGCAT GGAGCT CCT CGGGCAC CACCAAGAGT CAGAAGGC C 465 

I I II I I I II I I I I II I I I II II I I I I I I II I I I I I I I I I I I I I I I II I II I I II I II 
Db 361 GAAT ACT GGT GC CAGT GT GT GGCAT GGAGCTCCT C GGGT AC C ACCAAAAGT CAGAAGGC C 420 

Qy 4 66 TACATC CGCAT AGC CAGATT GCGCAAGAACTT C GAG C AGGAGCCGCT GGC CAAGGAGGT G 525 

I II I I II I II III I I I I I II I I II I I I I I I I I I I I I II I II I II I II I I III 

Db 421 TACATCCGGATTGCCTATTTGCGCAAGAACTTTGAGCAGGAGCCACTGGCCAAGGAAGTG 480 

Qy 526 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 585 

II I I II I II I I I I II II II II M II II II II II I II II I I I II III 

Db 481 T C ACT GGAGCAAGGCATT GTACT ACCT T GT CGC CCC C CAGAAGGAAT CCC C C CAGCT GAG 540 

Qy 586 GT GGAGT GGCT CCGGAAC GAGGACCT G GT GGAC C CGT CC CT GGAC C C CAAT GT AT ACAT C 645 

I Ml IN Ml I II II III I II II I I II I II I Mill II Ml I Ml I I I I I I I 
Db 541 GT GGAGT GGCTT CGAAATGAGGACCTCGT GGAC C CCT CCCT CGAT C C CAAT GTGT ACAT C 600 



Qy 


646 


AC GCGGGAGCACAGC CTGGT GGT GCGACAGGC CCGCCTTGCTGACAC GGCCAACT ACAC C 


705 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


601 


RCCZCdCZCZ ACr* APA^PPTAftTPf^Tf^Pf^TPAC^ppppppTppppp ar* ah 


DOU 


Qy 


706 


TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 


765 






II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 III 1 1 1 1 II II 1 1 1 1 1 II II 




Db 


661 


TftTCiTfiClPPAAriAAPATPftT AnpPP^TPfiPprizvar:papp r rpT^:pzi^PC* r iTP2i r P r rr ,r r r n r pa r r 

ivjioi uwu^rirvunnv»/ii ^uinvj^^vjl ^vjV^^»o.rt/-lbb.r\bb lOl bbrVbbbb 1 br\± 1 ol 1 1 /\1 


/zu 


Qy 


766 


GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 


825 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


721 


VJJ. V3fU"lV*V30 1 VJwl VjVj J. V^-OPVV^O X \JVJ/\b 1 0/\bJ i bbJ. ^l/Oivl bbM.bbbbbrt.bb 1 bl bbbbb 1 


7 on 

/OU 


Qy 


826 


GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 


885 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 III 






7R1 
/ox 


CZ(ZC' T rczczc Af^A A HCtZCZ AfZPPrzfZAPPTPP a.p*p* a Ar , rrTrPAr , r r rr r ?r' a Aprrrrrrrppfp^p 


q a n 
o4U 


Qy 


886 


TGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCACCCTGTGCCCAGTAGACGGCAGC 


945 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II II III 






Oil 


1 b ± brtbbbbbrt.brtrt.1 b 1 bbAbftMAALAbbb 1 bbbbbrtb lLlbi bbbbrtb 1 bbAl bGbAbb 


y uu 


Qy 


946 


TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 


1005 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




nh 


-7 \J X 


TPPA PlT"T'P , Pl r PPlPl A. PIT 1 A. APTPPTP A r , Pr ,r rr r rrrrP r ?'T 1 r , 7\ p , t , p*P' a p'p'p* a r"T< r" r* r* r*r* t\. r*r+r*t-*r* 
1 bbrtb 1 JL bb 1 bbrtb I /\/\vj 1 bbi brtbbb Ibl bbbb 1 1 bAb 1 bbALbbAb 1 obbbbAbCCbC 


Q C A 

you 


Qy 


1006 


GAGT GCT CTGACC C AGCACCC C GCAAC GGAGGGGAGGAGT GCCAGGGCACT GACCTGGAC 


1065 






1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 III 1 1 II 1 1 1 1 1 1 1 




nh 




PlAPI r PP!P* , T , P' r rf2AP , P'P , AP'P'AP*P*P*P , P*P*A ATPT AfPfPP APPAr , rnr , rnpr , r , r , pfprr , rrr , 7\ r*r*rn r* 
«Au ± bb Ibl bAbbbAbbAbbbbbbAAl bonob 1 brtbbrt,b lb 1 bbbbb 1 bb 1 bAbb I bbrtb 






1UDD 


A P*p* p*f^p* A ArTf^APPArTr AP , P"T , P"T'P' r T 1 P* r P A P* A P* A P*T 1 P , P*mrnp , rnp , P'P , P , r , rp/~ 71 r* r* Tn r* r*rn r* r* r* 

rtbbbbbrtrtb ibl rtbbrtb 1 brtbb 1 b 1 b 1 b 1 rtbrtbrtb 1 bb 1 1 CI bbbbb 1 bAbGAbb I GGCC 


llzo 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 MM I I I I I | Ml 1 1 1 1 1 1 1 




nh 




flfPrrfB 7\p , T , P'T , AP*P"AP* r PP'AP , P* r PP ,r PP'P , P* r PP'P*AP 7\ pppp^p^np^pm^ , r•r'r , r , / r, a r*r*T\ r*r^rn/—/—r*m 
AbbbbbAAb ibl AbbAb 1 bAbb J. b i bbb 1 bbAbAbbbb 1 Ibl 1 bbbbbbAGGAbGTGGbT 


1 A O A 

1080 


Qy 


1126 


CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 


1185 


nh 


lUOl 


1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

blblAbAibbbbbi iblbbblblbbblbibibbblbl 1 bl 1 bbTGT T GbTGGbbbTTGGA 


1140 


Qy 


1186 


CT CGTTT ATT GC C GGAAGAAGGAGGGGCT GGACT CAGAT GT GGCTGACT CGT C CATT CT C 


1245 






Ml 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 III 




nh 


1141 
nil 


P , T n P*AT^T , T , A.p' r pp* r PP , P*P , A A PI A A P P A AP*PT , P* r PP*P* 7±.r ,T T t r*fT' nTrTPrPPr' A P , T | P , P ,r PP*P* AT'/'" , /"'*rp/"» 
b 1 brtl 1 lrtb ibl bbLAAbAAbbrtAbbbb 1 bbAb 1 bbbAl b 1 bbbbbAb 1 bb i bbrtx bb 1 b 


UU 


Qy 


1246 


ACCTCAGGCTTCCAGCCCGTCAGCATCAAGCCCAGCAAAGCAGACAACCCCCATCTGCTC 


1305 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


X zl W J. 


A.P"P* r yip*PlPlPIP , T'T , P'P*AP'P , P ,, T 1 P , T , P'AP^P"A r PP'A j^^f^/~'^-7\r , r^7\7\7\r^/ r ^7\r*7\r , *7\ t\ r* c* C* C r* t\ rr'Trnmr* 
bbbbb 1 1 b brtbbb 1 b I bAbbAl bAAbbbbAbbAAAbbAbAbAAbbbbbAbb 1 bb 1 b 


1^ OU 


Qy 


1306 


ACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGG 


1365 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 III 1 II 




Db 


X U X 


ArrATrrArirranArr , Trzir:rArrz\r'par r parrzipp r rAPPAPpprAP r rpT i ATrTTrr nrp 

p\.<^v^PV± ObAbbbrtbAbb 1 bAbbAbbAbbAb 1 AbbAbb i. AbbAbbbbAb 1 biAl bl 1 bbAbb 




Qy 


1366 


CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 


1425 






1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1321 


CAGGATGGACCCAGCCCCAAGTTCCAGCTCTCTAATGGTCACCTGCTCAGCCCACTGGGG 


1380 


Qy 


1426 


GGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCC 


1485 






1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1381 


AGTGGCCGCCATACGTTGCACCACAGCTCACCCACCTCTGAGGCTGAGGACTTCGTCTCC 


1440 



Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



I486 CGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTAT 1545 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
1441 CGCCTCTCCACCCAAAACTACTTTCGTTCCCTGCCCCGCGGCACCAGCAACATGGCCTAC 1500 

1546 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1605 
I I I I I I I I I I I I I I II I I I I I I II I I I I I I II I II I I I I I I I I I II I I I I I I I I I I I I 
GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACGGGGATCAGCCTCCTC 1560 



1501 



1665 



1606 AT CCCCCCAGATGCCATACCCCGAGGGAAGATCTATGAGATCTACCT CACGCTGCACAAG 
II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AT AC CC C CGGAT GC CAT CC C CC GAGGAAAGATCT AC GAGAT CTAC CT CACACTGCACAAG 1620 



1561 



1666 



1725 



C C GGAAGAC GT GAGGTT GCCC CT AGCTGGCT GT C AGAC C CT GCT GAGT C C CAT C GTT AGC 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1621 CCAGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCAGTCGTTAGC 1680 

1726 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1785 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
1681 TGTGGGCCCCCAGGAGTCCTGCTCACCCGGCCAGTCATCCTTGCAATGGACCACTGTGGA 1740 

1786 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1845 

I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
1741 GAGCCCAGCCCTGACAGCTGGAGTCTGCGCCTCAAAAAGCAGTCCTGCGAGGGCAGTTGG 1800 

184 6 GAGGATGT GCT GC AC CT GGGCGAGGAGGCGC CCT C CCAC CT CTACT ACTGC CAGCT GGAG 1905 

I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1801 GAGGAT GT GCT GC AC CT T GGT GAGGAGT CAC CT T C CCAC CT CTACT ACT GC CAGCT GGAG 1860 

1906 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1965 

III I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
1861 GCCGGGGCCTGCTATGTCTTCACGGAGCAGCTGGGCCGCTTTGCCCTGGTAGGAGAGGCC 1920 

1966 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 2025 

I I I I I I I I I I I I I I I I I II II I I I I I I III I I I I I I I I I I I II MINIM || 
1921 CTCAGCGTGGCTGCCACCAAGCGCCTCAGGCTCCTTCTGTTTGCTCCCGTGGCCTGTACG 1980 

2026 T C CCT C GAGT ACAAC AT CC GGGT CTACT GCCTGCAT GAC ACC CAC GATGC ACT CAAGGAG 2085 

Mill I I II I I I I I I I I I I II I I I I I I I I II I I I I I I I II I I II I M II II I I 
1981 T C CCTT GAGT ACAACAT CC GAGT GT ACT GCCT ACAC GACACC CACGACGCT CTCAAGGAG 2040 

2086 GT GGT GCAGCTGGAGAAGCAGCT GGGGGGACAGCT GATC CAGGAG C CACGGGT CCT GCAC 2145 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I II I I I I I I I I I 
2041 GT GGT GCAGCT GGAGAAGCAGCT AGGT GGAC AGCT GAT C CAGGAGC CTCGC GT CCT GCAC 2100 

2146 T T CAAGGAC AGTT AC CACAACCT GCGCCT AT CCAT CC AC GAT GT GC C CAGCT C CCT GT GG 2205 

Mill I M I I I I II I I I I I I I I MM II I I I I II I I I I II I I I I I I M I I II I II 

2101 T T CAAAGAC AGTT AC CACAACCT AC GT CT CT CCAT CCAC GAC GT GC C CAGCT C CCT GT GG 2160 
2206 AAGAGT AAGCT CCTT GT CAGCT AC CAGGAGAT C C C CT TT TAT CAC AT CT GGAAT GGCAC G 2265 

Mill Mill I II I I I I II I M I I I II II II I I I I I I I I II M I I I I M Mill 
2161 AAGAGCAAGCTACT T GT CAGCTAC CAGGAGAT C C CTT TT T AC CACAT CT GGAACGGC AC C 2220 

2266 CAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTG 2325 
II II III I I I I I I M I II I II I II II I I I II I III I I I M I I I M I M M I 

2221 CAGCAGTATCTGCACTGCACCTTCACCCTGGAGCGCATCAACGCCAGCACCAGCGACCTG 2280 
2326 GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 2385 



Db 



2281 



I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I II I I 
GCCTGCAAGGTGTGGGTGTGGCAGGTGGAGGGAGATGGGCAGAGCTTCAACATCAACTTC 



2340 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 



2386 AACAT CACCAAGGACACAAGGTTTGCTGAGCTGCTGGCT CTGGAGAGTGAAGCGGGGGTC 2445 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I 
2341 AACAT CACTAAGGACACAAGGTTT GCT GAATT GTT GGCT CTGGAGAGTGAAGGGGGGGT C 2400 

2446 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATT 2505 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II 

24 01 CCAGC C CT GGT GGGC CC CAGT GC CTT CAAGAT CC C CTT C CTCATTC GGCAAAAGATCAT C 2460 

2506 TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 2565 

I I I I I I I I I I I I I I I I I I II Mill I I I I I I II I I I I I I I I I I I I I I I I I I 
2461 GC CAGT CT GGAC C CAC CCT GC AGC C GGGGCGC C GACTGGAGAACTCT AGCC C AGAAACT T 2520 



2566 



2625 



CAC CT GGAC AGCCAT CT CAGCTT CT TT GC CT CCAAGC CCAGCC C CACAGC CAT GATC CT C 
II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2521 C AC CT GGAC AGCCAT CTT AGCTT CTTT GC CT CCAAGC C CAGC C CTAC AGC CAT GATC CT C 2580 

2626 AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 2685 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
2581 AACCT ATGGGAGGCACGGC ACTT C C CCAAC GGCAAC CT C GGC CAGCT GGCAGC AGCT GT G 2640 

2686 GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGC 2745 

II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2641 GCCGGACTGGGCCAACCAGATGCTGGCCTCTTCACGGTGTCGGAGGCCGAGTGTTGAGAC 2700 

2746 CGGCCAG 2752 

I I I I I I 
2701 CAGCCAG 2707 
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Qy 46 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 105 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I 

Db 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGTGCTCCTGGGCATAGTCCTCGCCGCCTGGCTT 60 

Qy 106 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 165 

II II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 CGTGGTTCGGGTGCCCAGCAGAGTGCCACGGTGGCCAATCCAGTGCCCGGTGCCAACCCC 120 

Qy 166 GAC CTGCTT CCC C ACTT CCT GGT GGAGC C CGAGGAT GT GT ACAT CGTCAAGAACAAGC CA 225 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 121 GAC CTGCTGC CC C ACTT CCT GGT AGAGC CT GAGGACGT GTACATT GTCAAGAACAAGCCG 180 

Qy 226 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 285 

III II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 181 GTGTTGTTGGTGTGCAAGGCTGTGCCTGCCACCCAGATCTTCTTCAAGTGCAATGGGGAA 240 

Qy 286 TGGGTGCGCCAGGTGGACCACGTGATCGAGCGCAGCACAGACGGGAGCAGTGGGCTGCCC 345 

I I I I I I I I I I I I I II I I I I I II II I I I I I I I I III I I I I I I II I I I I 
Db 241 TGGGTCCGCCAGGTCGATCACGTAATTGAACGCAGCACCGACAGCAGCAGCGGATTGCCA 300 

Qy 346 ACCATGGAGGTCCGCATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCTGGAG 405 

I I I I I I I I I I I I I I II II II II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 301 AC C ATGGAGGT CC GT AT CAAC GT AT CGAGGCAGC AGGTAGAGAAAGTGT T T GGGCT GGAG 360 

Qy 406 GAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCC 465 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 GAAT ACT GGT GCCAGT GT GT GGC AT GGAGCT CCT C GGGT AC CAC CAAAAGTCAGAAGGCC 420 



Qy 466 T ACAT CC GCAT AGCCAGAT T GCGCAAGAACTT CGAGC AGGAGC CGCTGGC CAAGGAGGTG 525 

I I I I I I I I II III I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 421 TACAT CCGGATT GC CTATTT GCGCAAGAACTT T GAGCAGGAGCCACTGGCCAAGGAAGT G 480 

Qy 526 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 585 

II I II I I I I I I I I I I II II II II II II II II II I I I I I I I I I I III 

Db 481 T C ACT GGAGCAAGGC ATT GT ACT AC CTT GT CGCC CCC CAGAAGGAAT C C C CC CAGCTGAG 540 

Qy 586 GT GGAGT GGCT CCGGAAC GAGGACCT GGTGGACCCGT CCCT GGAC C CCAAT GT AT ACAT C 645 

I II II I I I I I I II II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 541 GTGGAGT GGCTT CGAAAT GAGGACCT C GT GGACCCCTCC CT C GAT C CCAAT GT GT ACATC 600 

Qy 646 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 705 

I I I I I II I I I I I I I I I I II I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 601 AC GC GGGAGCACAGC CTAGT C GT GC GT CAGGC CC GCCT GGCC GACACGGCCAACT ACAC C 660 

Qy 706 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 765 

II I I I I I I I I I I I I I I I I I II I I I I I I I I III I I I I II II I I I I I II II 

Db 661 TGTGTGGCCAAGAACATCGTAGCCCGTCGCCGAAGCACCTCTGCAGCGGTCATTGTTTAT 720 

Qy 766 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 825 

I I I I I II I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 721 GTGAACGGTGGGTGGTCGACGTGGACTGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGT 780 

Qy 826 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 885 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCACCTCTCAACGGGGGCGCCTTC 840 

Qy 886 T GT GAGGGGCAGAAT GT C CAGAAAACAGCCT GCGC C ACC CT GT GCCCAGT AGACGGCAGC 945 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I II II Ml 

Db 841 T GT GAGGGGCAGAAT GT C CAGAAAACAGC CT GCGC C ACT CT GT GC CCAGT GGATGGGAGC 900 

Qy 946 TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 1005 

I I I I I I I I I I II I I I I II I I I I I I I I I II I I I I I I II I I I I I I I I I II I I I I I I 

Db 901 TGGAGTTCGTGGAGTAAGTGGTCAGCCTGTGGGCTTGACTGCACCCACTGGCGGAGCCGC 960 

Qy 1006 GAGT GCT CT GAC C CAGCACC CCGCAAC GGAGGGGAGGAGT GC CAGGGCACT GACCT GGAC 1065 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I II I I I I I I I I I I I I 

Db 961 GAGT GCT CT GACC CAGCACCCC GCAAT GGAGGTGAGGAGTGT CGGGGT GCT GACCTGGAC 1020 

Qy 1066 ACCCGCAACT GTACCAGT GACCT CT GT GT ACACAGT GCTTCT GGCCCT GAGGACGT GGCC 1125 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 1021 ACCCGCAACTGTACCAGTGACCTCTGCCTGCACACCGCTTCTTGCCCCGAGGACGTGGCT 1080 

Qy 1126 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1185 

II I I I I I I I I I I I I I -I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1081 CTCTACATCGGCCTTGTCGCTGTGGCTGTGTGCCTCTTCTTGCTGTTGCTGGCCCTTGGA 1140 

Qy 1186 CTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTC 1245 

III I I I I II II I I I I I I I I I I I I I I II I I I I I II I I I I I I I II I I I I I I III 

Db 1141 CTCATTTACTGTCGCAAGAAGGAAGGGCTGGACTCCGATGTGGCCGACTCGTCCATCCTC 1200 

Qy 1246 ACCT CAGGCT T CCAGC CC GT C AGC AT CAAGCC CAGCAAAGCAGACAAC C CC C ATCT GCT C 1305 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 1201 AC CT CGGGCT T CCAGC CT GT C AGC AT CAAGCCCAGCAAAGCAGACAAC CCC CACCT GCT C 1260 

Qy 1306 ACC ATC CAGC C GGACCT CAGC AC C ACC AC CAC CACCT AC CAGGGCAGT CTCTGTCCCCGG 1365 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 III I II 

Db 1261 ACCATC CAGC CAGACCT CAGC AC CAC C ACT AC CACCT AC CAGGGC AGT CT ATGTTCGAGG 1320 



Qy 1366 CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 1425 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1321 CAGGATGGACCCAGCCCCAAGTTCCAGCTCTCTAATGGTCACCTGCTCAGCCCACTGGGG 1380 

Qy 1426 GGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCC 1485 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 AGTGGCCGCCATACGTTGCACCACAGCTCACCCACCTCTGAGGCTGAGGACTTCGTCTCC 1440 

Qy 1486 CGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTAT 1545 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 CGCCTCTCCACCCAAAACTACTTTCGTTCCCTGCCCCGCGGCACCAGCAACATGGCCTAC 1500 

Qy 1546 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1605 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACGGGGATCAGCCTCCTC 1560 

Qy 1606 AT CCCC C CAGAT GC CAT ACCC CGAGGGAAGAT CT ATGAGAT CTACCTCAC GCT GCACAAG 1665 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1561 ATACCCCCGGATGCCATCCCCCGAGGAAAGAT CTACGAGAT CTACCTCACACTGCACAAG 1620 

Qy 1666 CCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGC 1725 

II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1621 CCAGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCAGTCGTTAGC 1680 

Qy 1726 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1785 

I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I 
Db 1681 TGTGGGCCCCCAGGAGTCCTGCTCACCCGGCCAGTCATCCTTGCAATGGACCACTGTGGA 1740 

Qy 1786 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1845 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I III 
Db 1741 GAGCCCAGCCCTGACAGCTGGAGTCTGCGCCTCAAAAAGCAGTCCTGCGAGGGCAGTTGG 1800 

Qy 1846 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1905 

I I I I M I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I II I I I I I I I I II I I I I I 
Db 1801 GAGGATGTGCTGCACCTTGGTGAGGAGTCACCTTCCCACCTCTACTACTGCCAGCTGGAG 1860 

Qy 1906 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1965 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1861 GCCGGGGCCTGCTATGTCTTCACGGAGCAGCTGGGCCGCTTTGCCCTGGTAGGAGAGGCC 1920 

Qy 1966 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 2025 

I II II I I I I I I I I I I I I I I I I I II I II III I I I I I I I I I I I II I I I I I I I I II 
Db 1921 CTCAGCGTGGCTGCCACCAAGCGCCTCAGGCTCCTTCTGTTTGCTCCCGTGGCCTGTACG 1980 

Qy 2026 T C C CT C GAGT ACAAC AT CC GGGT CT ACT GCCT GC AT GACAC C CAC GAT GC ACT CAAGGAG 2085 

Mill I I I I II II I I I I I I II I I I II I I I II I I I I II I I I I I II I I I I I II I I 

Db 1981 TCCCTTGAGTACAACAT CCGAGT GTACT GCCTACACGACACCCACGACGCTCT CAAGGAG 204 0 

Qy 2086 GTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCAC 2145 

I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I II I I I I I I II I I I I I I I I I 
Db 2041 GT GGT GCAGCT GGAGAAGC AGCT AGGT GGACAGCT GAT C CAG GAGC CT C GC GT CCT GCAC 2100 

Qy 2146 TT CAAGG AC AGTT ACC ACAAC CT GCGCCTAT C CAT CC AC GAT GT GC CC AGCT C CCT GTGG 2205 

I I I I I I I I I I I I II I I I I I I I I II II I I I I II I I I I I I I I I II II I I I I I I I I I I 



Db 



2101 TT CAAAGACAGTT ACCACAACCT ACGT CTCT CC AT CCACGACGT GC CC AGCTC CCT GT GG 2160 



Qy 2206 AAGAGT AAGCT C CTT GT CAGCT AC CAGGAGATCCC CTTTT ATCACAT CT GGAAT GGCACG 2265 

Mill I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 2161 AAGAGCAAGCT ACT T GT CAGCT ACC AGGAGATCCCTTTTT ACCAC AT CT GGAAC GGCACC 2220 

Qy 2266 CAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTG 2325 

I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I 
Db 2221 CAGCAGT AT CT GCACT GCAC CTT CAC C CTGGAGC GC AT C AACGCCAGC AC CAGCGACCTG 2280 

Qy 2326 GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 2385 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I 
Db 2281 GCCTGCAAGGTGTGGGTGTGGCAGGTGGAGGGAGATGGGCAGAGCTTCAACATCAACTTC 2340 

Qy 2386 AACAT CAC CAAGGAC ACAAGGTT T GCT GAGCT GCT GGCT CT GGAGAGT GAAGCGGGGGT C 2445 

I II I I I I I I I I I II I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I 
Db 2341 AACAT CAC TAAGGACACAAGGTTT GCT GAATTGTT GGCT CT GGAGAGT GAAGGGGGGGT C 2400 

Qy 2446 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATT 2505 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I INN II 
Db 2401 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAAAAGATCATC 2460 

Qy 2506 TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 2565 

I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2461 GCCAGT CT GGAC C CACCCTGCAGC C GGGGCGCCGACT GGAGAACT CT AGC C CAGAAACT T 2520 

Qy 2566 CACCT GGACAGC CAT CT CAGCTT CT TT GCCT CCAAGCC CAGCCC CACAGCCAT GAT CCTC 2625 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 2521 CACCT GGACAGC CAT CTT AGCTT CT TT GCCT CCAAGC C CAGCCCTACAGCCAT GAT CCTC 2580 

Qy 2626 AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 2685 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I III 

Db 2581 AACCTATGGGAGGCACGGCACTTCCCCAACGGCAACCTCGGCCAGCTGGCAGCAGCTGTG 2640 

Qy 2686 GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGC 2745 

II II I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 2641 GCCGGACTGGGCCAACCAGATGCTGGCCTCTTCACGGTGTCGGAGGCCGAGTGTTGAGAC 2700 

Qy 2746 CGGCCAG 2752 

I I I I I I 

Db 2701 CAGCCAG 2707 



RESULT 8 

US-10-240-154-15 

; Sequence 15.,.. Application US/10240154 

; Publication No. US20030175741A1 

; GENERAL INFORMATION: 

; APPLICANT: Cochran et al. 

; TITLE OF INVENTION: SCHIZOPHRENIA RELATED GENES 

; FILE REFERENCE: CKFW-P01-006 

; CURRENT APPLICATION NUMBER: US/10/240,154 

; CURRENT FILING DATE: 2001-04-02 

; PRIOR APPLICATION NUMBER: PCT/GB01/01486 

; PRIOR FILING DATE: 2001-04-02 

; NUMBER OF SEQ ID NOS : 34 

SOFTWARE: Patentln version 3.2 



; SEQ ID NO 15 

LENGTH: 2697 
TYPE: DNA 

ORGANISM: Rattus sp. 
; FEATURE : 

NAME/KEY: CDS 

LOCATION: (1)..(2697) 
US-10-240-154-15 

Query Match 81.8%; Score 2252.2; DB 16; Length 2697; 

Best Local Similarity 89.7%; Pred. No. 0; 

Matches 2419; Conservative 0; Mismatches 278; Indels 0; Gaps 0; 

Qy 46 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 105 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I MM 

Db 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGTGCTCCTGGGCATAGTCCTCGCCGCCTGGCTT 60 

Qy 106 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 165 

II M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 CGTGGTTCGGGTGCCCAGCAGAGTGCCACGGTGGCCAATCCAGTGCCCGGTGCCAACCCC 120 

Qy 166 GAC CT GCTT C CCCACTT C CT GGT GGAGCCC GAGGAT GTGT ACAT C GT CAAGAACAAGC CA 225 

I I I M I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I 
Db 121 GAC CT GCT GC C C CACT T CCT GGT AGAGC CT GAGGACGTGT AC ATT GT CAAGAACAAGCCG 180 

Qy 226 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 285 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 GTGTTGTTGGTGTGCAAGGCTGTGCCTGCCACCCAGATCTTCTTCAAGTGCAATGGGGAA 240 

Qy 286 T GGGT GCGCCAGGT GGACCAC GT GAT CGAGC GCAGCACAGAC GGGAGCAGT GGGCT GC CC 345 

Mill I I I I I I I I II Mill M II I I II I II I III I Mill M MM 

Db 241 TGGGT CCGCC AGGT CGAT C AC GT AATT GAACGCAGCACCGACAGCAGCAGC GGAT T GCCA 300 

Qy 346 ACCATGGAGGTCCGCATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCTGGAG 4 05 

M M II I I M I II I II II M II II I II II II M I II II II I II II II II II I 
Db 301 AC CAT GGAGGT C C GT AT CAAC GT AT C GAGGCAGCAGGT AGAGAAAGT GTTT GGGCT GGAG 360 

Qy 406 GAAT ACT GGT GC C AGT GCGTGGCAT GGAGCT CCT CGGGCACCAC CAAGAGT CAGAAGGCC 465 

I I I II II II I I II I II I II I II II II I I I II II II II I I II II II II M M II II II 
Db 361 GAAT ACT GGT GC C AGT GT GT GGCAT GGAGCT CCT CGGGT ACCAC CAAAAGT CAGAAGGCC 420 

Qy 466 TACAT CC GC AT AGC C AGAT T GC GCAAGAACTTCGAGCAGGAGCC GCT GGCCAAGGAGGT G 525 

I M I M I I M II I I I II II I II II I II I II II I II I II II II I II II II III 
Db 421 TACAT C C GGATT GC CT AT TT GCGCAAGAACTTT GAGCAGGAGCCACT GGCCAAGGAAGT G 480 

Qy 526 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 585 

M I M II II I Mill II II II II II II II II II Mill II I II II I 
Db 481 TCACTGGAGCAAGGCATTGTACTACCTTGTCGCCCCCCAGAAGGAATCCCCCCAGCTGAG 540 

Qy 586 GT GGAGT GGCT C C GGAAC GAGGAC CTGGTGGAC C CGT CCCT GGAC CC CAAT GT AT ACAT C 645 

I I M I II II I I II II II II I II I I I I II I I I II I I I II I II II I M II II II 
Db 541 GT GGAGT GGCTTCGAAATGAGGACCTCGTGGACCCCTCCCTCGATCCCAATGTGTACATC 600 

Qy 64 6 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 705 

I I M II I II II II I II I II II I I I II I I I II I I II II I II II II II II I I II II I 
Db 601 ACGCGGGAGCACAGCCTAGTCGTGCGTCAGGCCCGCCTGGCCGACACGGCCAACTACACC 660 



Qy 706 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 765 

II I I I I I I I I I I I I I II I I II I I I I I I I I III II I I II II I I I I I II II 

Db 661 T GT GT GGC CAAGAACAT CGT AGC C C GT C GCCGAAGCACCT CT GCAGCGGT CATT GTTT AT 720 

Qy 766 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 825 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 721 GTGAACGGTGGGTGGTCGACGTGGACTGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGT 780 

Qy 826 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 885 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCACCTCTCAACGGGGGCGCCTTC 840 

Qy 886 TGT GAGGGGC AGAAT GT CCAGAAAACAGC CT GCGCCACC CT GT GCC C AGTAGAC GGCAGC 945 

I II I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II II III 

Db 841 T GT GAGGGGCAGAAT GT CCAGAAAACAGC CT GC GCCACT CT GT GCCC AGTGGAT GGGAGC 900 

Qy 946 TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 1005 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 901 TGGAGTTCGTGGAGTAAGTGGTCAGCCTGTGGGCTTGACTGCACCCACTGGCGGAGCCGC 960 

Qy 1006 GAGT GCT CT GAC C CAGCAC C C CGCAACGGAGGGGAGGAGT GC CAGGGC ACTGAC CT GGAC 1065 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I Ml I I I I I I I I I I I 

Db 961 GAGT GCT CT GACC CAGCAC C C CGCAAT GGAGGT GAGGAGT GT CGGGGT GCTGAC CT GGAC 1020 

Qy 1066 ACC C GCAACT GT ACCAGT GAC CT CT GT GT ACACAGT GCTT CT GGCC CT GAGGAC GT GGCC 1125 

I I I I I I I I I II I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I II I I II I 

Db 1021 ACCC GCAACTGT ACCAGT GACCT CT GC CT GCACAC C GCTT CTT GCC CC GAGGAC GT GGCT 1080 

Qy 1126 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1185 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1081 CTCTACATCGGCCTTGTCGCTGTGGCTGTGTGCCTCTTCTTGCTGTTGCTGGCCCTTGGA 1140 

Qy 1186 CTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTC 1245 

III I I II II II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I III 

Db 1141 CTCATTTACTGTCGCAAGAAGGAAGGGCTGGACTCCGATGTGGCCGACTCGTCCATCCTC 1200 

Qy 1246 ACCT CAGGCTT C CAGCCCGT CAGCAT CAAGCCCAGCAAAGCAGACAACCC CCAT CT GCTC 1305 

Mill I M I II I II I I I I I I M I I II I I I I I I I I II I I I I I II I I I II II I I I II I I 

Db 1201 ACCT CGGGCTT C CAGCCTGT CAGCAT CAAGC CCAGCAAAGC AGACAACC C CCAC CT GCTC 1260 

Qy 1306 AC CAT CC AGCCGGAC CTCAGCAC CACCACC ACCACCT AC CAGGGCAGT CT CT GT CCC CGG 1365 

I I I I I I I I I E I I II I I I I I I I I II I II I I I I I I II I I I I I I I I I I I I I II I I II 

Db 1261 AC CAT CC AGCCAGACCT CAGCAC CACCACT ACCACCT AC CAGGGCAGT CT AT GTT CGAGG 132 0 

Qy 1366 CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 1425 

I I I I I I II I I I I II MM I M I I I I I I I I I Mill I I I II I I I I II M I I I II I 

Db 1321 CAGGATGGACCCAGC C C CAAGTT C CAGCT CT CTAAT GGT CAC CT GCT CAGC CC ACT GGGG 1380 

Qy 1426 GGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCC 1485 

I I I II I I II M I II II I M I I II I I I I II II I I I I I I I Mill I II I II II I 

Db 1381 AGTGGCCGCCATACGTTGCACCACAGCTCACCCACCTCTGAGGCTGAGGACTTCGTCTCC 1440 

Qy 1486 C GC CT CT CCAC C CAGAACT ACTT CCGCT CCCT GCC C C GAGGCACC AGCAACAT GACCT AT 1545 

I II I I II I I II I I I I I I M II I II II II II I I II I II I I I II I I I II II I MM 

Db 1441 CGCCTCTCCACCCAAAACTACTTTCGTTCCCTGCCCCGCGGCACCAGCAACATGGCCTAC 1500 

Qy 1546 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1605 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 I I 1 1 1 1 1 1 1 l l ll l 1 1 I 1 1 I 1 1 1 n 

1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACGGGGATCAGCCTCCTC 1560 

1606 ATCCCCCCAGATGCCATACCCCGAGGGAAGATCTATGAGATCTACCTCACGCTGCACAAG 1665 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
1561 AT ACC CCC GGAT GCCAT C CC C CGAGGAAAGAT CT AC GAGATCT AC CTCACACT GCACAAG 1620 



1666 



1725 



CCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGC 
II I I II I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I II I I I I II I I I I I I I I I I 
1621 C CAGAAGAC GT GAGGTT GCCCCT AGCT GGCT GT CAGACC CT GCTGAGT C CAGT C GTT AGC 1680 

1726 TGTGGACCCCCTGGCGTGCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1785 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I 
1681 TGTGGGCCCCCAGGAGTCCTGCTCACCCGGCCAGTCATCCTTGCAATGGACCACTGTGGA 1740 

1786 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1845 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
1741 GAGCCCAGCCCTGACAGCTGGAGTCTGCGCCTCAAAAAGCAGTCCTGCGAGGGCAGTTGG 1800 

1846 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1905 

I I I I II I I I I I I I I I I I II II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1801 GAGGAT GT GCT GCACCT T GGT GAGGAGT CAC CTT CCCAC CTCT ACT ACT GCC AGCT GGAG 1860 

1906 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1965 

Ml I II I I I II I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I II I 
1861 GCCGGGGCCTGCTATGTCTTCACGGAGCAGCTGGGCCGCTTTGCCCTGGTAGGAGAGGCC 1920 

1966 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 2025 

I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I II I I I I I I I I II 
1921 CTCAGCGTGGCTGCCACCAAGCGCCTCAGGCTCCTTCTGTTTGCTCCCGTGGCCTGTACG 1980 

2026 T C C CT C GAGT ACAACAT C C GGGT CT ACT GC CT GCAT GAC ACC C AC GATGC ACT CAAGGAG 2085 

I I I M I II I I I I I I I I I I I II I I I I I I II II I I I I I I I I I I I II I I I I I I I I I 
1981 T C C CT T GAGT ACAACAT C CGAGT GT ACT GC CTACACGACACCCAC GACGCT CT CAAGGAG 2040 

2086 GT GGT GCAGCT GGAGAAGC AGCT GGGGGGAC AGCTGAT C C AGGAGC CAC GGGT C CT GCAC 2145 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
2041 GT GGT GCAGCT GGAGAAGCAGCT AGGT GGACAGCTGAT C CAGGAGCCT CGCGT C CT GCAC 2100 

2146 TT CAAGGAC AGT T AC C ACAAC CT GC GC CT AT CCATC CAC GAT GT GCCCAGCT CC CT GT GG 2205 

Mill II I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2101 TT CAAAGACAGTT ACC ACAAC CTACGT CT CT CCATC CAC GAC GT GCCCAGCT C C CT GT GG 2160 

2206 AAGAGTAAGCT CCT T GT CAGCT ACCAGGAGATC C CCTTT TAT CAC AT CT GGAAT GGCACG 2265 

I M I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
2161 AAGAGCAAGCT ACT T GT CAGCT AC CAGGAGAT C C CT TTT T AC C ACAT CT GGAAC GGC ACC 2220 

2266 CAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTG 2325 

I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I II I I I II I 
2221 CAGCAGTAT CT GCACT GCACCTT C ACC CT GGAGCGCAT CAACGC CAGCAC CAG C GAC CT G 2280 

2326 GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 2385 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
2281 GCCTGCAAGGTGT GGGT GT GGC AGGT GGAGGGAGATGGGCAGAGCTTCAACATCAACTTC 2340 

2386 AACATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTC 2445 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I 



Db 2341 AACAT CACTAAGGACACAAGGTTT GCTGAATTGT TGGCT CTGGAGAGT GAAGGGGGGGTC 2400 

Qy 2446 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATT 2505 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II 
Db 2401 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAAAAGATCATC 2460 

Qy 2506 TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 2565 

I I I I I I I I I I I I I I I I I I II I I II I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 2461 GCCAGTCTGGACCCACCCTGCAGCCGGGGCGCCGACTGGAGAACTCTAGCCCAGAAACTT 2520 

Qy 2566 CACCT GGACAGCCAT CT C AGCTT CT TTGCCT C CAAGC CCAGCCC CACAGC CAT GAT C CT C 2625 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2521 CACCT GGACAGC CAT CT T AGCTT CTTT GCCTCCAAGCCCAGC CCTACAGCCAT GAT CCT C 2580 

Qy 2626 AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 2685 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I III 

Db 2581 AACCTATGGGAGGCACGGCACTTCCCCAACGGCAACCTCGGCCAGCTGGCAGCAGCTGTG 2640 

Qy 2686 GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2742 

II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I III 

Db 2641 GCCGGACTGGGCCAACCAGATGCTGGCCTCTTCACGGTGTCGGAGGCCGAGTGTTGA 2697 



RESULT 9 
US-09-933-261-2 

; Sequence 2, Application US/09933261 
; Publication No. US20030040046A1 
; GENERAL INFORMATION: 

; APPLICANT: Tessier-Lavigne, Marc 

; Leonardo, E. David 

; Hink, Lindsay 

; Masu, Masayuki 

; Kazuko, Keino-Masu 

; TITLE OF INVENTION: Netrin Receptors 

; NUMBER OF SEQUENCES: 8 

CORRESPONDENCE ADDRESS: 
; ADDRESSEE: SCIENCE & TECHNOLOGY LAW GROUP 

; STREET: 268 BUSH STREET, SUITE 3200 

; CITY: SAN FRANCISCO 

STATE: CALIFORNIA 

COUNTRY: USA 

ZIP: 94104 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 

COMPUTER: IBM PC compatible 

OPERATING .SYSTEM: PC-DOS/MS-DOS 

SOFTWARE: Patentln Release #1.0, Version #1.30 
; CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/09/933,261 

FILING DATE: 20-Aug-2001 

CLASSIFICATION: <Unknown> 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: 08/808,982 

FILING DATE: <Unknown> 
; ATTORNEY/AGENT INFORMATION: 

NAME: OSMAN, RICHARD A 

REGISTRATION NUMBER: 36,627 



REFERENCE/ DOCKET NUMBER: UC96-217 
TELECOMMUNICATION INFORMATION: 
TELEPHONE: (415) 343-4341 
TELEFAX: (415) 343-4342 
INFORMATION FOR SEQ ID NO: 2: 
SEQUENCE CHARACTERISTICS: 

LENGTH: 1787 base pairs 
TYPE: nucleic acid 
STRANDEDNESS : double 
TOPOLOGY: linear 
MOLECULE TYPE: cDNA 

SEQUENCE DESCRIPTION: SEQ ID NO: 2: 
US-09-933-261-2 

Query Match 56.8%; Score 1562.4; DB 10; Length 1787; 

Best Local Similarity 98.5%; Pred. No. 0; 

Matches 1661; Conservative 0; Mismatches 16; Indels 9; Gaps 8; 

Qy 1070 GCAACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCT 1129 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 1 GCAACTGTACCAGTGACCTCTG-GTACACACTGCTTCTGGCCCTGAGGACGTGGCCCTCT 59 

Qy 1130 ATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCG 1189 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 60 ATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCG 119 

Qy 1190 TTT ATTGCCGGAAGAAGGAGGGGCT GGACT C AGAT GT GGCT GACT CGT CCATT CT CACCT 1249 

I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 120 T TT ATTGCCGGAAGAAGGAGGGGCT GGACT CAGAT GTGGCT GACT C GT CCATT CT CACCT 179 

Qy 1250 CAGGCTT CCAGCC CGT CAGCAT C - AAGC CCAGCAAAGCAGACAAC C C CCAT CT GCT CAC C 1308 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I II I I I I I I I I I I I I I I I I 
Db 180 CAGGCTTCCAGCCCGTCAGCATCTAAGCCCAGCAAAGCAGACAACCCCCATCTGCTCACC 239 

Qy 1309 AT C C AGCCGGAC CT CAGCAC CACCACCACCAC CT ACC AGGGCAGT CT CTGT CCC CGGCAG 1368 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 240 ATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAG 299 

Qy 1369 GATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGC 1428 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 300 GATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGC 359 

Qy 1429 GGC CGCCAC ACACT GCAC CACAGCT CT C CCAC CT CTGAGGC CGAGGAGTT CGT CT CC CGC 1488 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 360 GGCC GCCACAC ACT GCAC CACAGCT CT C C CACCT CT GAGGC C GAGGAGTT C GT CT CCC GC 419 

Qy 1489 CTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGG 1548 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 420 CTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGG 479 

Qy 1549 ACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATC 1608 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 480 ACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGAATCAGCCTCCTCATC 539 



Qy 

Db 



1609 C C CCCAGAT GC C AT ACC CCGAGGGAAGATCT AT GAGAT CT AC CT CACGCT GCACAAGCCG 1668 

I I I I I I I I I I I I I I I I I I I I I III III II III III II II II I II I I I I I I I II I II Ml I 

540 C C CCCAGAT GC C AT ACCCC GAGGGAAGATCT AT GAGAT CT AC CT CACGCT GCACAAGC CG 599 



Qy 1669 GAAGACGTGAGGTT GC C C CT AGCT GGCT GT CAGACCCT GCT GAGT C CCATC GTT AGCTGT 1728 

I I I I ! I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 600 GAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGT 659 

Qy 1729 GGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAG 1788 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 660 GGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAG 719 

Qy 1789 CCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAG 1848 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 720 CCCAGCCCTGACAGCTGGAGCCTGGCCCTCAAAAAGCAGTCGTGCGAGGG-AGCTGGGAG 778 

Qy 1849 GATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCC 1908 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 779 GATGT-CTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCC 837 

Qy 1909 AGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTC 1968 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 838 AGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTC 897 

Qy 1969 AGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCC 2028 

I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I 
Db 898 AGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCC 957 

Qy 2029 CTCGAGT ACAACAT CCGGGTCT ACTGCCT GCATGACACCCACGAT GCACTCAAGGAGGT G 2088 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 958 CT CGAGT ACAACAT CC GGGT CT ACT GC CT GCATGACACC CAC GAT GCACTCAAGGAGGT G 1017 

Qy 2089 GT GCAGCT GGAGAAGC AGCT GGGGGGAC AGCT GAT C CAGGAGCC AC GGGT CCT GCACTT C 2148 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1018 GTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTT- 1076 

Qy 2149 AAGGAC AGTT AC CACAAC CT GC GC CTAT C CAT CC AC GAT GT GCCCAGCT C C CT GT GGAAG 2208 

I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1077 AAGGACAGTT AC CACAAC CT — GC C CT AT CAT CCACGAT GT GCC CAGCT C CCT GT GGAAG 1134 

Qy 2209 AGTAAGCT CCT TGT CAGCTAC CAGGAGAT C CCCTTTT AT CACAT CT GGAAT GGCACGCAG 2268 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1135 AGTAAGCT C CTT GT CAGCTAC CAGGAGAT C CCCTTTT AT CACAT CT GGAAT GGCAC GCAG 1194 

Qy 2269 CGGT ACT TGCACT GC AC CTT CAC C CTGGAGC GTGT CAGC CCCAGCACT AGT GACCT GGC C 2328 

1 1 1 1 1 1 1 1 ii i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 1195 CGGT ACT T GCACT GCAC CTT CAC C CTGGAGC GTGT CAGC CC CAGCACT AGT GACCT GGCC 1254 

Qy 2329 TGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAAC 2388 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1255 TGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAAC 1314 

Qy 2389 ATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCA 2448 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 1315 ATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCA 1374 

Qy 2449 GCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCC 2508 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1375 GCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCC 1434 



Qy 

Db 



2509 AGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCAC 
I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1435 AGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCAC 



2568 
1494 



Qy 



Db 



2569 CT GGACAGC CAT CT C AGCTTCTTT GC CT CCAAGCCCAGCCCCACAGCCAT GAT C CT CAAC 2628 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1495 CT GGACAGCCAT CT CAGCTT CT T T GCCTC CAAGC CCAGC C CC ACAGCCAT GATC CT CAAC 1554 



Qy 



Db 



2629 CTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCT 2688 

I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
1555 CTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCT 1614 



Qy 



Db 



2689 GGACTGGGCCAGCCAGACGCTGGCCTC-TTCACAGTG-TCGGAGGCTGAGTGCTGAGGCC 2746 

M I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1615 GGGACTGGCCAGCAGGACGGTGGCTTCTTTCACAGTGTTCGGAGGCTGAGTGCTGAGGCC 1674 



Qy 



2747 GGCCAG 2752 
I I I I I I 



Db 



1675 GGCCAG 1680 



RESULT 10 
US-10-256-702-2 

; Sequence 2, Application US/10256702 
; Publication No. US20030059859A1 
GENERAL INFORMATION: 



TITLE OF INVENTION: Netrin Receptors 
NUMBER OF SEQUENCES: 8 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: SCIENCE & TECHNOLOGY LAW GROUP 

STREET: 268 BUSH STREET, SUITE 3200 

CITY: SAN FRANCISCO 

STATE: CALIFORNIA 

COUNTRY: USA 

ZIP: 94104 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 

COMPUTER: IBM PC compatible 

OPERATING SYSTEM: PC-DOS/MS-DOS 

SOFTWARE: Patentln Release #1.0, Version #1.30 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/ 10/256, 702 

FILING DATE: 27-Sep-2002 

CLASSIFICATION: <Unknown> 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: US/09/933,261 

FILING DATE:. 20-Aug-2001 

APPLICATION NUMBER: 08/808,982 

FILING DATE: <Unknown> 
ATTORNEY/AGENT INFORMATION: 

NAME: OSMAN, RICHARD A 

REGISTRATION NUMBER: 36,627 



APPLICANT: Tessier-Lavigne, Marc 



Leonardo, E. David 
Hink, Lindsay 
Masu, Masayuki 
Kazuko, Keino-Masu 



REFERENCE/ DOCKET NUMBER: UC96-217 
TELECOMMUNICATION INFORMATION: 
TELEPHONE: (415) 343-4341 
TELEFAX: (415) 343-4342 
INFORMATION FOR SEQ ID NO: 2: 
SEQUENCE CHARACTERISTICS: 

LENGTH: 1787 base pairs 
TYPE: nucleic acid 
STRANDEDNESS: double 
TOPOLOGY: linear 
MOLECULE TYPE: cDNA 

SEQUENCE DESCRIPTION: SEQ ID NO: 2: 
US-10-256-702-2 

Query Match 56.8%; Score 1562.4; DB 14; Length 1787; 

Best Local Similarity 98.5%; Pred. No. 0; 

Matches 1661; Conservative 0; Mismatches 16; Indels 9; Gaps 8; 

Qy 1070 GC AACT GT AC CAGT GAC CT CT GT GT ACACAGT GCTT CT GGC C CT GAGGAC GT GGC C CT CT 1129 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 GCAACTGTACCAGTGACCTCTG-GTACACACTGCTTCTGGCCCTGAGGACGTGGCCCTCT 59 

Qy 1130 ATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCG 1189 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 60 ATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCG 119 

Qy 1190 TTT ATT GCC GGAAGAAGGAGGGGCT GGACT CAGATGT GGCT GACT C GT C C ATT CTCACCT 1249 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 120 TT T AT T GC CGGAAGAAGGAGGGGCT GGACT CAGATGT GGCTGACT C GT C CATT CTCAC CT 179 

Qy 1250 CAGGCTTCCAGCCCGT CAGCAT C-AAGCCCAGCAAAGCAGACAACCCCCAT CTGCT CACC 1308 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I II I I I I 
Db 180 CAGGCTTCCAGCC C GT CAGCAT CTAAGC CCAGCAAAGCAGACAAC C C CCAT CT GCT CACC 239 

Qy 1309 AT C CAGCC GGACCT C AGCAC CAC CACCACCACCT AC C AGGGCAGT CT CT GT C CC C GGC AG 1368 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I 

Db 240 AT C C AGCCGGAC CT CAGCAC CAC CAC CACCACCT ACCAGGGC AGT CT CT GT C CC CGGCAG 299 

Qy 1369 GATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGC 1428 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 300 GATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGC 359 

Qy 1429 GGCC GC CACAC ACT GCACCACAGCT CT CCCACCT CT GAGGCCGAGGAGTT C GT CT CCC GC 1488 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 360 GGCCGCCACACACTGCACCACAGCTCT CCCACCT CTGAGGCCGAGGAGTTCGTCTCCCGC 419 

Qy 1489 CTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGG 1548 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 420 CTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGG 479 

Qy 1549 ACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATC 1608 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 480 ACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGAATCAGCCTCCTCATC 539 

Qy 1609 CCCCCAGAT GC C AT ACCCC GAGGGAAGAT CTAT GAGATCT AC CT C ACGCT GC ACAAGCCG 1668 

I I I I I I III I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I 
Db 540 CCCCCAGAT GC C AT ACC CC GAGG GAAGAT CT AT GAGATCT AC CT C ACGCT GC ACAAGCCG 599 



Qy 


1669 


GAAGAC GTGAGGT T GCC C CT AGCT GGCT GT CAGAC CCT GCT GAGT CCCAT C GTT AGCT GT 


1728 






1 1 1 M 1 1 1 1 1 1 1 1 t 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


600 


GAAfi AC GTG AGGTTGC C C CT A HPT G GCTCT c a c a c nc r rrr r r fi a r*T r* r*r t Tx T rr , r r v T v&.m T vr T r 




Qy 


1729 


GGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAG 


1788 






1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


660 


GGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCI^TCCTCZC^CTATfZCZI^CCIiCTCTCCCCTiC 


1 1 Q 


Qy 


1789 


CCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAG 


1848 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 




Db 


720 


CCC AGCCCTGILC H.(ZCT(Z(Z7XCZCCT(ZfZCCCTCL. a 21 a arT* 2ir*T , r , r' r P/^r , r*Zir , r*r'— ar , r ,r PrTT*7\r' 


/ / O 


Qy 


1849 


GATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCC 


1908 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


779 


GATGT—CTGCACCTGGGCGACiCiACi(ZCCZCCCTCCC7xccvrv7\rv7\rwrr , r7xrn T vrrTir t rr'r' 


oo / 


Qy 


1909 


AGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTC 


1968 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


L> J O 


A G T G C C T d C T A C C T C T T C a C C C a C C a C C T C C C C C C C T T T C C C ^ kT V^'^ ^^ T , ^*^*^*^s.^*^s.^*^ % ^ % ^*^* r vr , 
■rWJ x 1 o^l/iUo J. J. J. ^/\^Ub/\bL./\oL 1 bbbULbL 1 1 i bbbb 1 bb 1 bbbAbAbbbbb J. L 


o y / 


Qy 


1969 


AGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCC 


2028 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




nh 


ft Q P 
o y o 


/ibL^jl biob* 1 oL*b,ob^/\M\jb*ljb*L» I Ks.J\t\\jK*. 1 brU ilbiolll VjL.VjL.L'Oo i CjvjUL* I bLALLl L-b* 


OCT 


Qy 


2029 


CTCGAGTACAACATCCGGGTCTACTGCCTGCATGACACCCACGATGCACTCAAGGAGGTG 


2088 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 




CT C CTXCV A P A A P AT r , r' , (tL('ZfZ r T i r ,r P Zir , T/^Pr*T , r , r*AT l ^Ar , Ar , r*r^Ar , r'AT , r'r , Ar , T i r , A Ar*/~ ArT ,r p/"" 


1U1 / 


Qy 


2089 


GTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTTC 


2148 






M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


-L \J X O 


o 1 i Kj \jJ\KjJ-\J-\Kj <^.J-\.\j k^, 1 bTbjb7broo/\^/\brb. 1 LLAbbAbLLALbbb 1 Ub* 1 bLAb II - 


1U / D 


Qy 


2149 


AAGGACAGTTACCACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGGAAG 


2208 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 III 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1 077 


^-w-\.vjo/\v»,^\ij i l Ai^^/\b*/\/\b»b, 1 bbbblAi LAI LtALbAi bi bxb,b*b*/\brU 1 LLL IVjl brbrAAbj 


1 1 O A 

±±o4 


Qy 


2209 


AGTAAGCTCCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACGCAG 


2268 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1 1 


APT A APPT PPTTPTr* A Pr*T Zir , r^2i^^Zi^AT , r , r , r'r'T 1 T n T , T , AT n r , Ar^A r rr' r nr*r , A Rfprrcarrr'Ar 
rtuirtAu^. i^^l luj, b/\bb l/\b»b,/\bJO>\bj.rt.x LULL ill U/\L./\J. b>. I bbAAl bj bi LAb bi U/Yb? 




Qy 


2269 


CGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCC 


2328 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1 1 qs 

X X ^ «-/ 


C CC T A C T T CZ C A CT dC A r* C T T 1 r* A C C* C T C c Jx c r* c T c* T 1 r* a c r* r* ^ , ^ 1 fl^'^ , R^"^a^T^apr"pr'^ , r , r , 


IOC/I 


Qy 


2329 


TGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAAC. 


2388 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1255 


x u^nAo^ i«i vjvjo lui \j\d\^t\\j\j x kjVjM.^jVjij\^o>\b^bJbFo^/\vj/\ob-' X 1 bAbbAl L-rVrt.L- 1 1 


1 Ol A 
1 J 1 fl 


Qy 


2389 


AT CAC CAAGGACACAAGGTTT GCT GAGCT GCT GG CT CT GGAGAGT GAAGC GGGGGT C CC A 


2448 






1 1 1 1 1 1 M 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 




Db 


1315 


AT CACCAAGGACACAAGGTTT GCT GAGCT GCT GGCT CT GGAGAGT GAAGC GGGGGT CCCA 


1374 


Qy 


2449 


GCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCC 


2508 






II 1 1 1 1 1 1 1 1 II 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I I I I I I I I || I I | 




Db 


1375 


GCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCC 


1434 



Qy 2509 AGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCAC 2568 

I I I I I I ! I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 1435 AGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCAC 1494 

Qy 2569 CTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAAC 2628 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1495 CTGGACAGCCAT CT C AGCT T CTT T GC CT CCAAGCC CAGC CCCACAGCCAT GAT CCT CAAC 1554 

Qy 2 62 9 CTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCT 2688 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I 

Db 1555 CTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCT 1614 

Qy 2689 GGACTGGGCCAGCCAGACGCTGGCCTC-TTCACAGTG-TCGGAGGCTGAGTGCTGAGGCC 2746 

II I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I II I II I I I I I I I I I I I 

Db 1615 GGGACTGGCCAGCAGGACGGTGGCTTCTTTCACAGTGTTCGGAGGCTGAGTGCT GAGGC C 1674 

Qy 2747 GGCCAG 2752 

I I I I I I 

Db 1675 GGCCAG 1680 



RESULT 11 
US-10-296-115-365 

; Sequence 365, Application US/10296115 
; Publication No. US20040053248A1 
; GENERAL INFORMATION: 
; APPLICANT: Hyseq Inc 

; TITLE OF INVENTION: No. US2004005324 8Alel Nucleic Acids and Polypeptides 
; FILE REFERENCE: 784PCT 

; CURRENT APPLICATION NUMBER: US/10/296,115 

; CURRENT FILING DATE: 2002-11-18 

; PRIOR APPLICATION NUMBER: US09/488,725 

; PRIOR FILING DATE: 2000-01-21 

; PRIOR APPLICATION NUMBER: US09/552,317 

; PRIOR FILING DATE: 2000-04-25 

; NUMBER OF SEQ ID NOS : 1478 

; SEQ ID NO 365 

LENGTH: 1321 

TYPE: DNA 
; ORGANISM: Homo sapiens 
US-10-296-115-365 

Query Match 43.8%; Score 1206.6; DB 17; Length 1321; 

Best Local Similarity 98.0%; Pred. No. 1.2e-299; 

Matches 1295; Conservative 0; Mismatches 19; Indels 7; Gaps 7; 

Qy 1435 CACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCC 1494 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 CAC ACACTGCAC CAC AGCT CT C C C AC CT CT GAGGC C GAGGAGTT CGTCTCCCGCCTCTCC 60 

Qy 1495 ACC CAGAACT ACTTC C GCT CC CT GC CCC GAGGC AC CAGCAACAT GAC CTAT GGGAC CT T C 1554 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 ACC CAGAACT ACTT C CGCTCCCTGCCCC GAGGC AC CAGCAACAT GAC CTAT GGGAC CTT C 120 

Qy 1555 AACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCA 1614 

I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 AACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGAATCAGCCTCCTCATCCCCCCA 180 



Qy 1615 GATGCCATACCCCGAGGGAAGATCTATGAGATCTACCTCACGCTGCACAAGCCGGAAGAC 1674 

I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 181 GAT GC CAT ACC C CGAGGGAAGAT CT AT GAGAT CT AC CTC ACGCTGCACAAGC CGGAAGAC 240 

Qy 1675 GTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCC 1734 

II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I 

Db 241 GTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCC 300 

Qy 1735 CCT-GGCGTCCTGCTCACCCGGCCAGTCATCCT-GGCTATGGACCACTGT-GGGGAGCCC 1791 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 301 CCTGGGCGTCCTGCTTACCCGGCCAGTCATCCTGGGGTATGGACCACTGTGGGGGAGCCC 360 

Qy 1792 AGCCCT GACAGCT- GGAGCCT GCGCCT CAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGA 1850 

I I I M I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 361 AGCCCTGACAGCTGGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGA 420 

Qy 1851 TGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAG 1910 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 421 TGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAG 480 

Qy 1911 TGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAG 1970 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 TGCCTGCTACGTCTTCACCGAGCAGCTGAGCCGCTATGCCCTGGTGGGAGAGGCCCTCAG 540 

Qy 1971 CGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCT 2030 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 541 CGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCT 600 

Qy 2031 CGAGTACAACAT CCGGGT CTACTGCCT GCATGACACCCACGATGCACTCAAGGAGGT GGT 2090 

I I I I I I I I I I I I I MINIMUM Ml I I I I I I I I I I I II I I I I I I I 

Db 601 CGAGTACAACAT ACT GGT CT ACT GC CT GCAT GAC ACT CACGAT GC ACT CAAC GT AGT GGT 660 

Qy 2091 GCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTTCAA 2150 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I 
Db 661 GCAGCT GGAGAAGC AGCT GCAGGGAC AGCT GAT CCAGGAGC CAC T GGT ACT GCACT T CAA 720 

Qy 2151 GGACAGTT ACCACAAC CT GCGCCT AT C CAT C CACGAT GT GCCCAGCT CC CT GT GGAAGAG 2210 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 GGACAGTT ACC ACAAC CT GCGC CT AT C CAT CC AC GAT GT GCCCAGCT CCCT GT GGAAGAG 780 

Qy 2211 TAAGCT CCTTGT CAGCT ACC AGGAGAT CCC CTTTTAT CACAT CT GGAAT GGCAC GCAGCG 2270 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 TAAGCT CCT TGT CAGCT AC C AGGAGAT C CC CTTTTAT CACAT CT GGAAT GGCAC GCAGCG 840 

Qy 2271 GTACTT GCACT GCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTG 2330 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 841 GTACTT GCACT GCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTG 900 

Qy 2331 CAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAACAT 2390 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I 

Db 901 CAAGCT GT GGGTGT GGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCAT CAACTTCAACAT 960 

Qy 2391 CACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGC 2450 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 961 CAC CAAGGACACAAGGTTT GCT GAGCT GCT GGCT CT GGAGAGT GAAGC GGGGGT CC C AGC 1020 



Qy 2451 CCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAG 2510 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 CCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAG 1080 

Qy 2511 CCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCT 2570 

I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 CCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCT 1140 

Qy 2571 GGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCT 2630 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 GGACAGC CATCT CAGCTTCTTT GCCTCCAAGC CCAGC CCCACAGC CAT GAT C CT CAAC CT 1200 

Qy 2631 GTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCT-G 2689 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1201 GTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGG 1260 

Qy 2690 GACTGGGCCAGCCAGACGCTGGCCTC-TTCACAGTG-TCGGAGGCTGAGTGCTGAGGCCG 2747 

I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1261 GACTGGGCCAGCAGGACGGTGGCTTCTTTCACAGTGTTCGGAGGCTGAGTGCTGAGGCCG 1320 

Qy 2748 G 2748 

I 

Db 1321 G 1321 
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Qy 143 ACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATG 202 

I I I Ml M I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 168 ACTCCTTCCCGTCAGCGCCAGCAGAGCCGCTGCCCTACTTCCTGCAGGAGCCACAGGACG 227 

Qy 203 T GT ACATC GTCAAGAACAAGCCAGT GCT GCTT GT GT GCAAGGC CGT GCC C GCCAC GC AGA 262 

I I I I I I I I I I I I I II I I I I I I III I M I I I I I I I I I I I I I I I I 

Db 228 CCTACATTGTGAAGAACAAGCCTGTGGAGCTCCGCTGCCGCGCCTTCCCCGCCACACAGA 287 

Qy 263 TCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTGGACCACGTGATCGAGCGCAGCA 322 

N I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II II 
Db 288 T CT ACTT CAAGT GCAAC GGCGAGT GGGT CAGCCAGAACGACCAC GT C ACACAGGAAGGC C 347 

Qy 323 CAGACGGGAGCAGTGGGCTGCCCACCAT GGAGGTCCGCATTAAT GT CTCAAGGCAGCAGG 382 

I I I I M I I I I II I I I I I I II I II I I I I I I I I II I 

Db 348 TGGATGAGGCCACCGGTCTGCGGGTGCGCGAGGTGCAGATCGAGGTGTCGCGGCAGCAGG 407 

Qy 383 TCGAGAAGGTGTTCGGGCTGGAGGAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGG 442 

I Ml M I M II I I I I I I I I I I I I I I I I I I I I I I II I III I I I I I I I I I I III 
Db 408 TGGAGGAGCTCTTTGGGCTGGAGGATTACTGGTGCCAGTGCGTGGCCTGGAGCTCCGCGG 467 

Qy 443 GC ACCAC CAAGAGT C AGAAGGC CTACAT CCGCAT AGC CAGAT T GC GCAAGAACTT CGAGC 502 

I I I I I I I I I I I I I I I I I I I I I I I I I II I III I I I I I I I I I I I I I I I I I 

Db 468 GC ACCAC CAAGAGT CGC C GAGC CT AC GT CC GCAT CGCCT AC CT GCGCAAGAACTT CGAT C 527 

Qy 503 AGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCAC 562 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 528 AGGAGCCTCTGGGCAAGGAGGTGCCCCTGGACCATGAGGTTCTCCTGCAGTGCCGCCCGC 587 

Qy 563 CGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGT 622 



Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 



588 



623 



648 



683 



708 



743 



768 



803 



828 



863 



888 



923 



948 



I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

CGGAGGGGGT GC CT GT GGCC GAGGT GGAAT GGCT CAAGAAT GAGGAT GT CATCGAC CC CA 647 

C CCT GGACCC CAAT GTATACAT CAC GCGGGAGC ACAGC CT GGTGGT GC GACAGGCCCGCC 682 
I I I I I I I I I I I I I II I I I I I II I I I I I I I II I I I I I I I I 

CCCAGGACACCAACTTCCTGCTCACCATCGACCACAACCTCATCATCCGCCAGGCCCGCC 707 

TTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCG 742 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

T GT C GGACACT GC CAACT AT AC CT GC GT GGCCAAGAACAT CGT GGCCAAACGC CGGAGCA 767 

CCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCG 802 

II I II I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I II II I I I I 
CCACTGCCACCGTCATCGTCTACGTGAATGGCGGCTGGTCCAGCTGGGCAGAGTGGTCAC 827 

TCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGG 862 

I I I I I I II I I I I I II I I I I I I I II I I II I I I I I I I II I I I I I I I I I I 
CCTGCTCCAACCGCTGTGGCCGAGGCTGGCAGAAGCGCACCCGGACCTGCACCAACCCCG 887 

CGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCA 922 
I II I I I I I I I I II II I I I I I I I I I I III I I I I I I I II I I I I I I III 

CTCCACTCAACGGAGGGGCCTTCTGCGAGGGCCAGGCATTCCAGAAGACCGCCTGCACCA 947 

CCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGG 982 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CCAT CTGCCCAGT CGAT GGGGC GT GGAC GGAGT GGAGCAAGT GGTCAGCCT GCAGCACT G 1007 



983 ACTGCAC CCACT GGC GGAGCCGT GAGT GCT CT GAC C CAGCACC CC GCAACGGAGGGGAGG 1042 
III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1008 AGTGTGCCCACTGGCGTAGCCGCGAGTGCATGGCGCCCCCACCCCAGAACGGAGGCCGTG 1067 

1043 AGT GCCAGGGCACT GAC CT GGAC ACCCGCAACT GT AC CAGT GAC CTCT GT GT ACAC AGTG 1102 

I I II I I I I M III I I I I I I I I II I I I I III I 

1068 ACT GCAGC GGGACGCTGCT C GACT CTAAGAACT GC AC AGAT GGGCTGT GCATGCAACT GG 1127 

1103 CTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGG 1162 

I III II I I I I I I I I I III I I I I 

1128 AGGCCTCAGGGGATGCGGCGCTGTATGCGGGGCTCGTGGTGGCCATCTTCGTGGTCGTGG 1187 



1163 



1222 



TCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAG 
III II II I I I I I I I I I I I I I I I I I I I I 

1188 CAATCCTCATGGCGGTGGGGGTGGTGGTGTACCGCCGCAACTGCCGTGACTTCGACACAG 1247 

1223 AT GT GGCT GACT CGT CCATT CTCACCTCAGGCTTCCAGCCCGTCAGCATCAAGCCCA 1279 

I I I I I I I I I I I I II I I II I I I II I I I I I I I I I I I I I 

1248 ACAT CACT GACT CAT CT GCT GC C CT GACTGGT GGTTT CCACCCC GT CAACTTTAAGAC GG 1307.. 



1280 



1333 



GCAAAGC AGACAAC CCCCAT CT GCT CACCATCCAGCCGGACCTCAGCACCACCA 

I I I I I I I I I I I I I II II I I I I I I I I I I I I 

1308 CAAGGCC CAGTAACC CGC AGCT C CT ACACC CCT CT GT GCCT C CT GAC CTGACAGC CAGCG 1367 

1334 C CAC CAC CT AC C AGGGCAGT CT CT GT C CCCGGCAGGA 1370 

II I I I I I I I II I I I I I I I I I I I I 

1368 C C GGCAT CT AC C GCGGACCCGT GT AT GC CCT GCAGGACTC CAC C GACAAAAT C CC CAT GA 1427 



1371 



-TGGGCCCAGCCCCAAGTTCCAGCTCACCA- 
I I I I I I I I I I I I I I I I II 



1399 



1428 CCAACTCTCCTCTGCTGGACCCCTTACCCAGCCTTAAGGTCAAGGTCTACAGCTCCAGCA 1487 

1400 — ATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACAC ACTGCACC 1447 

I I I I I I I I I I I I I I I I I I I I III 

1488 CCACGGGCTCTGGGCCAGGCCTGGCAGATGGGGCTGACCTGCTGGGGGTCTTGCCGCCTG 1547 

1448 ACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACCCAGAACTACT 1507 

I I I I I I I I I I I I I I I I I I I I I I II 

1548 GCACATACCCTAGCGATTTCGCCCGGGACACCCACTTCCTGCACCTGCGCAGCGCCAGCC 1607 

1508 TCCGCTC C CT GC CCCGAGGC ACCAGCAACAT GACCTAT GGGACCT 1552 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1608 TCGGTTCCCAGCAGCTCTTGGGCCTGCCCCGAGACCCAGGGAGCAGCGTCAGCGGCACCT 1667 

1553 TCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCC 1612 

I I I I I I I I I I I I I I I Mill I I I I I MINIM I I I I 
1668 TTGGCTGCCTGGGTGGGAGGCTCAGCATCCCCGGCACAGGGGTCAGCTTGCTGGTGCCCA 1727 

1613 CAGAT GCC AT ACCC C GAGGGAAGAT CT AT GAGAT CT ACCT CAC GCT GC ACAAGC C GGAAG 1672 

I I I I I I I II I I I I I I I I I I I M I I I I I I I I I I I I I I I I 

1728 AT GGAGCC ATT C CC CAGGGCAAGTT CT AC GAGAT GT AT CT ACT CAT CAACAAGGCAGAAA 1787 

1673 ACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGAC 1732 

I II I I II I I I I I I I I I I I I I I I I I I I II II I 

1788 GT AC C CTGCCGCT TT C AGAAGGGACCCAGACAGT AT TGAGCCCCT C GGT GACCT GT GGAC 1847 

1733 CCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCA 1792 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II II 
1848 CCACAGGCCTCCTGCTGTGCCGCCCCGTCATCCTCACCATGCCCCACTGTGCCGAAGTCA 1907 

1793 GCCCT GACAGCTGGAGCCTGCGCCT CAAAAAGCAGT CGT GCGAGGGCAGCTGGGAGGAT G 1852 

I I II I II I I I MINI I I I I I I I I I I I I I I I I I I I I 
1908 GT GCC C GT GACT GGAT CTTT CAGCT CAAGACCC AG GCC CACC AGGGC C ACT GGGAGGAGG 1967 

1853 TGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTG 1912 

MM Mill I I II I I I I I I II II I I M I II M I I I I I II I I I 
1968 T GGT GACCCT GGAT GAGGAGACCCT GAACAC AC C CT GCT ACT GC CAGCT GGAGC CCAGGG 2027 

1913 CCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCG 1972 

MM Mill I I I I I I I I I I I II I I M I II I II I 

2028 CCTGTCACATCCTGCTGGACCAGCTGGGCACCTACGTGTTCACGGGCGAGTCCTATTCCC 2087 

1973 TGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCG 2032 

I II I II I I I I I I I I I I II I I I II I I I I II I II I I I II I I 

2088 GCTCAGCAGTCAAGCGGCTCCAGCTGGCCGTCTTCGCCCCCGCCCTCTGCACCTCCCTGG 2147 

2033 AGT ACAACAT C C GGGT CT ACT GC CT GCAT GAC AC CCACGATGCACT CAAGGAGGT GGT GC 2092 

II I I I I I II II I I I I I I I I I M II I I I I I I I I I I I I I II I II I I II II 

2148 AGTACAGCCTCCGGGTCTACTGCCTGGAGGACACGCCTGTAGCACTGAAGGAGGTGCTGG 2207 

2093 AGCTGGAGAAGCAGCTGGGGGGACAGCT GAT CCAGGAGC CAC GGGT CCTGCACTTCAAGG 2152 

I I I II I II I I I I I I I I I I III I I I II II II I I I I I I I 
2208 AGCT GGAGC GGACTCTGGGC GGAT ACTT GGT GGAGGAGCCGAAACCGCTAATGTTCAAGG 2267 

2153 ACAGTT ACC ACAAC CT GCGC CTAT C CAT C CAC GAT GTGC C CAGCTCC CT GT GGAAGAGT A 2212 

II I II Ml I I II I I II I I Ml I III II I I II I II I Ml || II III I 

2268 ACAGTTACCACAACCTGCGCCTCTCCCTCCATGACCTCCCCCATGCCCATTGGAGGAGCA 2327 



Qy 

Db 



2213 AGCT CCTTGT CAGCT AC CAGGAGAT C C CCTTTT AT CACATCT GGAAT GGCACGCAGC GGT 2272 

I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I III I 
2328 AGCT GCT GGCCAAAT AC CAGGAGAT CCC CTT CT AT CACATTT GGAGTGGCAGCCAGAAGG 2387 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



2273 ACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCA 2332 

I I I I I I I I I I II I I I I I I I I I I I I I I I III I I I I I I I I I I 

2388 CCCTCCACTGCACTTTCACCCTGGAGAGGCACAGCTTGGCCTCCACAGAGCTCACCTGCA 2447 

2333 AGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAACATCA 2392 

I I I I I I I I I II I I II I I I I I I I I I I I I III I I II I 

2448 AGAT CT GCGT GC GGCAAGT GGAAGGGGAGGGC C AGATAT T CCAGCTGCAT ACCACT CT GG 2507 

2393 CCAAG GACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAG 2449 

III III II II I II I I I I 

2508 CAGAGACACCTGCTGGCTCCCTGGACACTCTCTGCTCTGCCCCTGGCAGCACTGTCACCA 2567 

2450 CCCT GGTGGGCC C CAGT GC CT T CAAGAT C CC CTT C CTCATT C GGCAGAAGATAATTT CCA 2509 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
2568 CCCAGCT GGGAC CTT ATGC CT T CAAGAT C C CACT GT CCATC CGCCAGAAGATAT GCAACA 2627 

2510 GCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACC 2569 

I I I I I I I IN I I I I I I I I I I I I I I I I II I I I I I I I I 

2628 GCCTAGATGCCCCCAACTCACGGGGCAATGACTGGCGGATGTTAGCACAGAAGCTCTCTA 2687 



2629 



2570 T GGACAGCC AT CT CAGCTT CTTT GC CT CCAAGCCCAGCCCCACAGCCAT GAT C CTCAACC 
I II I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I II I 
2688 TGGACCGGTACCTGAATTACTTTGCCACCAAAGCGAGCCCCACGGGTGTGATCCTGGACC 2747 

2630 TGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTG 2689 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I III I 

2748 T CT GGGAAGCTCT GCAGCAGGACGAT GGGGAC CT CAACAGC CT GGCGAGT GCCTTGGAGG 2807 

2690 GACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2742 

I I I I I I I II I I I I I I I I I I I I II 

2808 AGAT GGGCAAGAGT GAGAT GCT GGT GGCT GT GGC CACCGAC GGGGACT GCT GA 2860 



RESULT 13 
US-10-087-684-3 

; Sequence 3, Application US/10087684 
; Publication No. US20040029116A1 
; GENERAL INFORMATION: 



APPLICANT: 


Edinger, 


Shlomit R. 


APPLICANT: 


MacDougall, John R. 


APPLICANT: 


Millet, 


Isabelle 


APPLICANT: 


Ellerman, Karen 


APPLICANT: 


Stone, 


David J. 


APPLICANT: 


Grosse, 


William M. 


APPLICANT: 


Lepley, 


Denise M. 


APPLICANT: 


Rieger, 


Daniel K. 


APPLICANT: 


Burgess 


, Cathereine E. 


APPLICANT: 


Casman, 


Stacie, J. 


APPLICANT: 


Spytek, 


Kimberly A. 


APPLICANT: 


Boldog, 


Ferenc L. 


APPLICANT: 


Li, Li 




APPLICANT: 


Padigaru, Muralidhara 



APPLICANT: Mishra, Vishnu 
APPLICANT: Shenoy, Suresh-G. 
APPLICANT: Rastelli, Luca 
APPLICANT: Tchernev, Velizar T. 
APPLICANT: Vernet, Corine A.M. 
APPLICANT: Zerhusen, Bryan D. 
APPLICANT: Malyankar, Uriel M. 
APPLICANT: Guo, Xiaojia 
APPLICANT: Miller, Charles E. 
APPLICANT: Gangolli, Esha A. 

TITLE OF INVENTION: PROTEINS AND NUCLEIC ACIDS ENCODING SAME 
FILE REFERENCE: 21402-214 CIP 
CURRENT APPLICATION NUMBER: US/10/087,684 
CURRENT FILING DATE: 2003-03-10 
PRIOR APPLICATION NUMBER: 60/253,834 
PRIOR FILING DATE: 2000-11-29 
PRIOR APPLICATION NUMBER: 60/250,926 
PRIOR FILING DATE: 2000-11-30 
PRIOR APPLICATION NUMBER: 60/264,180 
PRIOR FILING DATE: 2001-01-25 
PRIOR APPLICATION NUMBER: 60/274,194 
PRIOR FILING DATE: 2001-03-08 
PRIOR APPLICATION NUMBER: 60/313,656 
PRIOR FILING DATE: 2001-08-20 
PRIOR APPLICATION NUMBER: 60/327,456 
PRIOR FILING DATE: 2001-10-05 
NUMBER OF SEQ ID NOS : 220 
SOFTWARE: CuraSeqList version 0.1 
SEQ ID NO 3 
LENGTH: 2860 
TYPE: DNA 

ORGANISM: Homo sapiens 
FEATURE : 
NAME/ KEY: CDS 
LOCATION: (59) . . (2857) 
US-10-087-684-3 

Query Match 34.0%; Score 936.2; DB 17; Length 2860; 

Best Local Similarity 61.7%; Pred. No. 3.6e-230; 

Matches 1662; Conservative 0; Mismatches 938; Indels 93; Gaps 7; 

Qy 143 ACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATG 202 

Ml III M I I I I I I I I I I I I I I I I I I I I I II I II I I I 

Db 168 ACTCCTTCCCGTCAGCGCCAGCAGAGCCGCTGCCCTACTTCCTGCAGGAGCCACAGGACG 227 

Qy 203 TGT ACATC GT CAAGAACAAGC CAGT GCT GCTTGT GT GCAAGGC CGT GCC C GC CAC GCAGA 262 

I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I II 
Db 228 CCT ACATT GT GAAGAACAAGC CT GT GGAGCT TC GCT GCCGCGCCTTCCCCGC CACAC AGA 287 

Qy 263 TCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTGGACCACGTGATCGAGCGCAGCA 322 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II 
Db 288 TCTACTTCAAGTGCAACGGCGAGTGGGTCAGCCAGAACGACCACGTCACACAGGAAGGCC 347 



Qy 

Db 



323 
348 



CAGACGGGAGCAGT GGGCT GCC C ACCAT GGAGGT CC GC AT T AAT GT CT CAAGGC AGCAGG 382 

I I I I M I I I I I I I I I I I I II I II II I I I I I I I I I 

TGGATGAGGCCACCGGCCTGCGGGTGCGCGAGGTGCAGATCGAGGTGTCGCGGCAGCAGG 4 07 



Qy 383 TCGAGAAGGTGTTCGGGCTGGAGGAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGG 442 

I III I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 408 TGGAGGAGCTCTTTGGGCTGGAGGATTACTGGTGCCAGTGCGTGGCCTGGAGCTCCGCAG 467 

Qy 443 GCAC CACCAAGAGT CAGAAGGCCT ACAT C C GCAT AGCCAGATT GC GCAAGAACTT CGAGC 502 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I II I I I I I I I I I I I I I 

Db 468 GCAC CACCAAGAGT C GCCGAGCCTAC GT CC GCAT CGC CT ACCT GC GCAAGAACTT CGAT C 527 

Qy 503 AGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCAC 562 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 528 AGGAGCCTCTGGGCAAGGAGGTGCCCCTGGACCATGAGGTTCTCCTGCAGTGCCGCCCGC 587 

Qy 563 CGGAGGGCAT CC CT C C AGC C GAGGT GGAGT GGCT CCGGAACGAGGACCT GGT GGAC C C GT 622 

I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I II I I I I I I I I I 
Db 588 CGGAGGGGGTGCCTGTGGCCGAGGTGGAATGGCTCAAGAATGAGGATGTCATCGACCCCA 647 

Qy 623 CCCTGGACCCCAATGTATACATCACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCC 682 

M I I I I I I I I I I I II I II fill III I I I I I II II I I I I I 

Db 648 CCCAGGACACCAACTTCCTGCTCACCATCGACCACAACCTCATCATCCGCCAGGCCCGCC 707 

Qy 683 TT GCT GACACGGC CAACT ACACCT GC GT GGCCAAGAAC AT CGT GGCAC GT C GC C GCAGCG 742 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I III 

Db 708 TGTCGGACACTGCCAACTATACCTGCGTGGCCAAGAACATCGTGGCCAAACGCCGGAGCA 767 

Qy 743 CCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCG 802 

Mill I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 768 CCACT GCCACCGT CATC GT CT AC GT GAAT GGCGGCT GGT C CAGCT GGGCAGAGT GGT CAC 827 

Qy 803 TCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGG 862 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 828 CCTGCTCCAACCGCTGTGGCCGAGGCTGGCAGAAGCGCACCCGGACCTGCACCAACCCCG 887 

Qy 863 CGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCA 922 

I II I I I I II I I II I I I I I I I I I I I I II I I I I I I I I II I I I I I I III 

Db 888 CT CCACTCAACGGAGGGGC CT T CT GC GAGGGCCAGGCATT CCAGAAGAC CGC CT GCAC C A 947 

Qy 923 CCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGG 982 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 948 CCATCTGCCCAGTCGATGGGGCGTGGACGGAGTGGAGCAAGTGGTCAGCCTGCAGCACTG 1007 

Qy 983 ACT GC ACC CACT GGCGGAGC C GT GAGT GCT CT GACC C AGCAC C CC GCAAC GGAGGGGAGG 1042 

III I II I I I I I I I I I I I I I II I I I I II I I I I I I I I I I II I I I 
Db 1008 AGT GT GCC CACT GGC GT AGC C GCGAGT GCAT GGC GCC CC CAC C CC AGAACGGAGGCCGT G 1067 

Qy 1043 AGT GCCAGGGCACT GAC CT GGACAC CCGCAACT GT AC CAGT GAC CT CT GT GT ACACAGT G 1102 

I I I I MM I I I I I I I I I I I I I II I I I I III I 

Db 1068 ACT GCAGCGGGAC GCT GCT CGACTCTAAGAACTGCACAGATGGGCTGT GCAT GCAACTGG 1127 

Qy 1103 CTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGG 1162 

I III II I I I I I I I I I II I I I I I 

Db 1128 AGGCCTCAGGGGATGCGGCGCTGTATGCGGGGCTCGTGGTGGCCATCTTCGTGGTCGTGG 1187 

Qy 1163 TCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAG 1222 

III II II I I I I II II II I I I I I M I II 

Db 1188 CAATCCTCATGGCGGTGGGGGTGGTGGTGTACCGCCGCAACTGCCGTGACTTCGACACAG 1247 



Qy 1223 AT GTGGCT GACT C GT C CATT CT CAC CT CAGGCTT CC AGCC C GT C AGCAT CAAGC CCA 1279 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



I I 1 1 1 1 1 1 1 1 1 l 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 l l 1 1 1 l 

1248 ACATCACTGACTCATCTGCTGCCCTGACTGGTGGTTTCCACCCCGTCAACTTTAAGACGG 



1307 



1280 GCAAAGCAGACAACC CCCAT CT GCT CACCATCCAGCCGGACCTCAGCACCACCA 1333 

I I I I I I I I I I I I I I, I II I I I I I I I I I I I I 

1308 CAAGGCCCAGTAACCCGCAGCTCCTACACCCCTCTGTGCCTCCTGACCTGACAGCCAGCG 1367 

1334 CCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAGGA 1370 

II I I I I I I I II I I I I I I I I I I I I 

1368 CCGGCAT CT ACCGCGGACCCGT GT AT GC C CT GCAGGACT C CAC CGACAAAAT CCC CAT GA 1427 

1371 T GGGC C CAGC C C CAAGTT CCAGCT CAC CA 1399 

I I I I I I I I I I I I I I I I II 
1428 CCAACT CT CCT CTGCTGGAC C C CTT ACCCAGC CT T AAGGT CAAGGT CT AC AGCT CCAGCA 1487 

1400 — ATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACAC ACTGCACC 1447 

I II I I I I I I I I I I I I II I I I IN 

1488 CCACGGGCTCTGGGCCAGGCCTGGCAGATGGGGCTGACCTGCTGGGGGTCTTGCCGCCTG 1547 

1448 ACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACCCAGAACTACT 1507 

I I I I I I I I I II I I I 1111111 I II 

1548 GCACATACCCTAGCGATTTCGCCCGGGACACCCACTTCCTGCACCTGCGCAGCGCCAGCC 1607 

1508 TCCGCTC CCTGCCCCGAGGCACCAGCAACATGACCTATGGGACCT 1552 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

1608 TCGGTTCCCAGCAGCTCTTGGGCCTGCCCCGAGACCCAGGGAGCAGCGTCAGCGGCACCT 1667 

1553 TCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCC 1612 

I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I 

1668 TTGGCTGCCTGGGTGGGAGGCTCAGCATCCCCGGCACAGGGGTCAGCTTGCTGGTGCCCA 1727 



1613 



1672 



CAGAT GCCATACCCCGAGGGAAGAT CTATGAGAT CTACCT CACGCTGCACAAGCCGGAAG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1728 AT GGAGCCATT C CCCAGGGCAAGTT CT AC GAGAT GT ATCT ACT CAT CAACAAGGCAGAAA 1787 

1673 ACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGAC 1732 

I M II M II I II I I I I I I I I I I I I I I I I I I I 

1788 GT ACC CTGC CGCTTT CAGAAGGGAC C CAGACAGT ATT GAGCCC CT CGGT GACCT GT GGAC 1847 

1733 CCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCA 1792 

I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I II I I 
1848 CCACAGGCCTCCTGCTGTGCCGCCCCGTCATCCTCACCATGCCCCACTGTGCCGAAGTCA 1907 

1793 GCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATG 1852 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

1908 GT GCCC GT GACT GGAT CTTT CAGCT CAAGAC C CAGGCCCACC AGGGC C ACT GGGAGGAGG 1967 

1853 TGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTG 1912 

M I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1968 TGGTGACCCT GGATGAGGAGACCCT GAACACACCCT GCTACTGCCAGCT GGAGCCCAGGG 2027 

1913 CCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCG 1972 

I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I 

2028 CCTGTCACATCCTGCTGGACCAGCTGGGCACCTACGTGTTCACGGGCGAGTCCTATTCCC 2087 



1973 TGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCG 
I II I I I I I I I III I I I I I I II II II I I I I I I I I I I I I I I 



2032 



Db 2088 GCTCAGCAGTCAAGCGGCTCCAGCTGGCCGTCTTCGCCCCCGCCCTCTGCACCTCCCTGG 2147 

Qy 2033 AGT ACAACATC CGGGT CT ACT GCCT GCATGACACCCACGAT GCACT CAAGGAGGT GGT GC 2092 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2148 AGTACAGCCTCCGGGTCTACTGCCTGGAGGACACGCCTGTAGCACTGAAGGAGGTGCTGG 2207 

Qy 2093 AGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTTCAAGG 2152 

I II I I I II I I I I I I I I I I III I I I I I I I II I I I I I I I 

Db 2208 AGCT GGAGC GGACT CTGGGC GGAT ACTT GGT GGAGGAGCC GAAAC CGCTAATGTT CAAGG 2267 

Qy 2153 ACAGTTACCACAACCT GCGCCT AT CCAT CC AC GAT GTGCCCAGCT CCCT GT GGAAGAGTA 2212 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I 

Db 2268 ACAGTTACCACAACCTGCGCCTCTCCCTCCATGACCTCCCCCATGCCCATTGGAGGAGCA 2327 

Qy 2213 AGCTCCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACGCAGCGGT 2272 

I I I I II I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I III I 

Db 2328 AGCT GCT GGCCAAAT ACCAGGAGAT C C C CTT CT AT C ACATTT GGAGT GGCAGCC AGAAGG 2387 

Qy 2273 ACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCA 2332 

I I I I II I I I I I I I I I I I I I I I I I I I I I III MM I I II II 

Db 2388 CCCT CCACT GCACT TTCACCCT GGAGAGGCACAGCTT GGC CTCCACAGAGCT CACCT GCA 2447 

Qy 2333 AGCT GTGGGT GT GGCAGGTGGAGGGC GACGGGC AGAGCTT CAGCAT CAACTT CAACAT CA 2392 

II I I I I II I II I II II I II II II I II I III I I II I 

Db 2448 AGAT CTGCGT GC GGCAAGTGGAAGGGGAGGGC C AGAT ATT C CAGCT GCAT ACC ACT CT GG 2507 

Qy 2393 CCAAG GACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAG 244 9 

III III II II I II II I I 

Db 2508 CAGAGACACCTGCTGGCTCCCTGGACACTCTCTGCTCTGCCCCTGGCAGCACTGTCACCA 2567 

Qy 2450 CCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCA 2509 

II I I II II II II I II II I II I II II I I I I I I I I II I II II II 
Db 2568 CCCAGCT GGGACCTTATGCCTTCAAGAT CCCACT GTCCAT CCGCCAGAAGATAT GCAACA 2627 

Qy 2510 GCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACC 2569 

II II I I I I I I II II I II I II II II I I II II I II II I 

Db 2628 GCCT AGAT GC C C CCAACT CACGGGGCAATGACT GG C GGAT GT T AGCAC AGAAGCT CT CTA 2687 

Qy 2570 TGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACC 2629 

II I II I I II I I I II II I I I I I I I I I II II II I I II II II II I 
Db 2688 TGGACCGGTACCTGAATTACTTTGCCACCAAAGCGAGCCCCACGGGTGTGATCCTGGACC 2747 

Qy 2630 TGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTG 2689 

I II II I II I I II I I II I I I II I I II II I II III I 

Db 2748 TCTGGGAAGCTCTGCAGCAGGACGATGGGGACCTCAACAGCCTGGCGAGTGCCTTGGAGG 2807 

Qy 2690 GACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2742 

II I II II II I I I II I II II II II 

Db 2808 AGATGGGCAAGAGTGAGATGCTGGTGGCTGTGGCCACCGACGGGGACTGCTGA 2860 

RESULT 14 
US-10-218-779-1 

; Sequence 1, Application US/10218779 
; Publication No. US20040029222A1 
; GENERAL INFORMATION: 
; APPLICANT: Edinger, Shlomit 



APPLICANT: MacDougall, John 
APPLICANT: Millet, Isabelle 
APPLICANT: Ellerman, Karen 
APPLICANT: Stone, David 
APPLICANT: Gerlach, Valerie 
APPLICANT: Grosse, William 
APPLICANT: Alsobrook II, John 
APPLICANT: Lepley, Denise 
APPLICANT: Rieger, Daniel 
APPLICANT: Burgess, Catherine 
APPLICANT: Casman, Stacie 
APPLICANT: Spytek, Kimberly 
APPLICANT: Boldog, Ferenc 
APPLICANT: Li, Li 
APPLICANT: Padigaru, Muralidhara 
APPLICANT: Mishra, Vishnu 
APPLICANT: Patturajan, Meera 
APPLICANT: Shenoy, Suresh 
APPLICANT: Rastelli, Luca 
APPLICANT: Tchernev, Velizar 
APPLICANT: Vernet, Corine 
APPLICANT: Zerhusen, Bryan 
APPLICANT: Malyankar, Uriel 
APPLICANT: Guo, Xiaojia 
APPLICANT: Miller, Charles 
APPLICANT: Gangolli, Esha 

TITLE OF INVENTION: Proteins and Nucleic Acids Encoding Same 
FILE REFERENCE: 21402-214 

CURRENT APPLICATION NUMBER: US/ 10/2 18 , 779 
CURRENT FILING DATE: 2002-08-14 
PRIOR APPLICATION NUMBER: 60/253,834 
PRIOR FILING DATE: 2000-11-29 
PRIOR APPLICATION NUMBER: 60/250,-926 
PRIOR FILING DATE: 2000-11-30 
PRIOR APPLICATION NUMBER: 60/264,180 
PRIOR FILING DATE: 2001-01-25 
PRIOR APPLICATION NUMBER: 60/313,656 
PRIOR FILING DATE: 2001-08-20 
PRIOR APPLICATION NUMBER: 60/327,456 
PRIOR FILING DATE: 2001-10-05 
NUMBER OF SEQ ID NOS: 216 
SOFTWARE: Patent In Ver. 2.1 
SEQ ID NO 1 
LENGTH: 2860 
TYPE: DNA 

ORGANISM: Homo sapiens 
US-10-218-779-1 



Query Match 34.0%; 
Best Local Similarity 61.7%; 
Matches 1662; Conservative 



Score 936.2; DB 17; 
Pred. No. 3.6e-230; 
0; Mismatches 938; 



Length 2860; 
Indels 93; Gaps 



7; 



Qy 



Db 



143 ACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATG 202 

Ml III II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

168 ACTCCTTCCCGTCAGCGCCAGCAGAGCCGCTGCCCTACTTCCTGCAGGAGCCACAGGACG 227 



Qy 203 T GT AC AT C GT CAAGAACAAGC CAGT GCT GCTT GT GTGCAAGGCCGTGC CCGCC AC GCAGA 262 



Db 



I I I I I I I I I I I I I I I I I I I I I III III I I I I I I I I II I I I I I I 
228 C CT ACATT GT GAAGAACAAGC CT GT GGAGCT C C GCT GCCGC GC CTT CCC CGCCACACAGA 287 



Qy 263 T CTTCTT CAAGT GCAACGGGGAGT GGGT GC GC CAGGTGGAC C ACGT GAT CGAGCGCAGCA 322 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I II II 
Db 288 T CTACTT CAAGT GCAACGGC GAGT GGGT CAGCCAGAACGACCACGT CACAC AGGAAGGCC 347 

Qy 323 CAGACGGGAGC AGT GGGCT GC CCACCAT GGAGGT CCGCATT AATGT CT CAAGGCAGCAGG 382 

I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 348 TGGAT GAGGCCACCGGTCT GC GGGT GCGCGAGGT GCAGAT C GAGGT GTC GC GGCAGCAGG 407 

Qy 383 TCGAGAAGGTGTTCGGGCTGGAGGAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGG 442 

I II I II I II I I I I I I I II II I I II I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 408 TGGAGGAGCTCTTTGGGCTGGAGGATTACTGGTGCCAGTGCGTGGCCTGGAGCTCCGCGG 467 

Qy 443 GCACCAC CAAGAGT CAGAAGGCCT ACAT C CGC AT AGC CAGATT GC GCAAGAACTT CGAGC 502 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I II I 

Db 468 GCACCAC CAAGAGT CGCCGAGCCTACGT CCGCAT CGCCTACCTGCGCAAGAACTT CGATC 527 

Qy 503 AGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCAC 562 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 528 AGGAGCCTCTGGGCAAGGAGGTGCCCCTGGACCATGAGGTTCTCCTGCAGTGCCGCCCGC 587 

Qy 563 C GGAGGGCAT C C CT C CAGCC GAGGT GGAGT GGCT CC GGAAC GAGGAC CT GGT GGACCCGT 622 

M II M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 588 CGGAGGGGGT GC CT GT GGCC GAGGT GGAAT GGCT CAAGAAT GAGGAT GT CAT CGACCCCA 647 

Qy 623 C C CTGGACCCC AAT GT AT ACATCACGCGGGAGCACAGC CT GGT GGT GCGACAGGCCC GCC 682 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 64 8 CCCAGGACACCAACTTCCTGCTCACCATCGACCACAACCTCATCATCCGCCAGGCCCGCC 707 

Qy 683 TTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCG 742 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 708 T GT CGGACACT GCCAACT AT ACCT GCGT GGCCAAGAACAT CGT GGCCAAAC GC C GGAGCA 767 

Qy 743 CCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCG 802 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7 68 C CACT GCCAC C GTCAT C GT CT AC GT GAAT GGCGGCT GGT CC AGCT GGGC AGAGT GGTCAC 827 

Qy 803 TCTGCAGCGCCAGCTGT GGGC GCGGCTGGCAGAAACGGAGCC GGAGCT GCACCAACCCGG 862 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 828 CCTGCTCCAACCGCTGTGGCCGAGGCTGGCAGAAGCGCACCCGGACCTGCACCAACCCCG 887 

Qy 863 CGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCA 922 

I II I I I I I I II II II I I I I I I I I I I I II I I I I I I I II I I I I I I III 

Db 8 88 CT CCACT CAAC GGAGGGGCCT TCT GCGAGGGC CAGGCATTCCAGAAGACC GCCT GCAC CA 947 

Qy 923 CCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGG 982 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 948 C CATCT GCC C AGT CGATGGGGCGT GGAC G GAGT GGAGCAAGT GGT C AGCCT GCAGCACT G 1007 

Qy 983 ACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGG 1042 

III I I I I I I I I I I I I I I I I I I I I I I II I II II I I I I I I I I I I 
Db 1008 AGTGTGCCCACTGGCGTAGCCGCGAGTGCATGGCGCCCCCACCCCAGAACGGAGGCCGTG 1067 

Qy 1043 AGT GCCAGGGCACT GACCT GGACAC CCG CAACT GTACC AGT GACCT CT GT GT AC ACAGT G 1102 

I I I I I I I I I I I I I I I I I I I I I II I I I I III I 
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1068 ACT GCAGCGGGACGCTGCT C GACT CTAAGAACT GCACAGAT GGGCT GT GCATGCAACT GG 1127 

1103 CTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGG 1162 

I I I I I I I I I I I I I I I III I I I I 

1128 AGGCCTCAGGGGATGCGGCGCTGTATGCGGGGCTCGTGGTGGCCATCTTCGTGGTCGTGG 1187 

1163 TCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAG 1222 

III II II I I I I I I I I I I I I I I I I I I I I 

1188 CAATCCTCATGGCGGTGGGGGTGGTGGTGTACCGCCGCAACTGCCGTGACTTCGACACAG 1247 



1223 



1279 



AT GT GGCT GACT C GT CCATT CTCACCTCAGGCTTCCAGCCCGTCAGCATCAAGCCCA 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1248 ACAT CACT GACT CAT CT GCT GCC CT GACTGGT GGT TT CCACC C C GT CAACTTT AAGAC GG 1307 

1280 GCAAAGCAGACAAC C CC C AT CT GCT CACCATCCAGCCGGACCTCAGCACCACCA 1333 

I I I I I I I I I I I I I II II I I I I I I I I I I I I 

1308 CAAGGCCCAGTAACCCGCAGCTCCTACACCCCTCTGTGCCTCCTGACCTGACAGCCAGCG 1367 

1334 CCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAGGA 1370 

I I I I I I I II I I I I I I I I I I I I I I 

1368 CCGGCATCTACCGCGGACCCGTGTATGCCCTGCAGGACTCCACCGACAAAATCCCCATGA 1427 

1371 TGGGCCCAGCCCCAAGTTCCAGCTCACCA 1399 

II I I I I I I I I I I II I I II 
1428 CCAACTCTCCTCTGCTGGACCCCTTACCCAGCCTTAAGGTCAAGGTCTACAGCTCCAGCA 1487 

1400 — ATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACAC ACTGCACC 1447 

i mi i i in ii i i 1 1 1 i i i in 

1488 CCACGGGCTCTGGGCCAGGCCTGGCAGATGGGGCTGACCTGCTGGGGGTCTTGCCGCCTG 1547 

1448 AC AGCT CT CCC ACCT CT GAGGC CGAGGAGT T CGT CT CC CGC CT CT CCACC CAGAACT ACT 1507 

I I I I I I I I I I I I I I I I I I I I I I II 

1548 GC AC AT ACCCT AGC GAT T TC GC C CGGGAC AC C CACTT C CT GCACCT GC GCAGC G C CAGC C 1607 

1508 TCCGCTC C CT GCC CCGAGGC AC CAGCAACAT GACCT AT GGGACCT 1552 

I I I I I I I I I I I I I I I I I I MM I I I I I I I 

1608 TCGGTTCCCAGCAGCTCTTGGGCCTGCCCCGAGACCCAGGGAGCAGCGTCAGCGGCACCT 1667 



1553 



1612 



TCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCC 
I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I Ml 

1668 TTGGCTGCCTGGGTGGGAGGCTCAGCATCCCCGGCACAGGGGTCAGCTTGCTGGTGCCCA 1727 

1613 CAGAT GCCATACCCCGAGGGAAGATCTATGAGAT CTACCTCACGCTGCACAAGCCGGAAG 1672 

I I I I II I I I I II I I I I I II I I I I I II II I I II II I II I 

1728 AT GGAGC CATT CCCCAGGGCAAGTT CT ACGAGATGTAT CT ACT CAT CAACAAGGCAGAAA 1787 



1673 



1732 



ACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGAC 
I M II II Mill I I I II I I I II I I II I I I I I 

1788 GT ACC CT GC C GCTTT CAGAAGGGAC C C AGACAGT ATT GAGC CC CT CGGT GACCT GT GGAC 1847 



1733 



1792 



CCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCA 
I I I I I I M M II I I I I I I I I I I I I I I I I II I M I II I I II II 
184 8 CCACAGGCCT C CT GCT GTGC CGC CC CGT CAT CCTCAC CAT GCCC CACT GT GCC GAAGTCA 1907 



1793 



1852 



GCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATG 
I I I I I I I I I I I I I I I I Mil I I I I I I I I I I I I I I I I 

1908 GTGCCCGTGACTGGATCTTTCAGCTCAAGACCCAGGCCCACCAGGGCCACTGGGAGGAGG 1967 
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1853 TGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTG- 1912 

I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1968 T GGT GAC C CT GGATGAGGAGACCCTGAAC ACAC CCT GCTACTGCCAGCT GGAGCC CAGGG 2027 

1913 CCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCG 1972 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

2028 CCTGTCACATCCTGCTGGACCAGCTGGGCACCTACGTGTTCACGGGCGAGTCCTATTCCC 2087 

1973 TGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCG 2032 

I II I I I I I I I III I I I I I I II II II I I I I I I I I I I I I I I 

2088 GCTCAGCAGTCAAGCGGCTCCAGCTGGCCGTCTTCGCCCCCGCCCTCTGCACCTCCCTGG 2147 

2033 AGT ACAACATCCGGGT CTACTGC CT GCAT GACAC C CACGAT GC ACT CAAGGAGGT GGT GC 2092 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
2148 AGT AC AGC CT C C GGGT CT ACT GCCT GGAGGAC ACGC CT GT AGCACT GAAGGAGGT GCT GG 2207 

2093 AGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGT CCT GCACTTCAAGG 2152 

I I I I I I II I I I I I I I I I I III I I I I I I I II I I I I I I I 

2208 AGCTGGAGCGGACTCTGGGCGGATACTTGGTGGAGGAGCCGAAACCGCTAATGTTCAAGG 2267 

2153 AC AGTT AC CACAAC CT GC GCCT AT C CAT C CAC GAT GT GCC CAGCTCCCT GT GGAAGAGT A 2212 
I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I 

ACAGTTACCACAACCTGCGCCTCTCCCTCCATGACCTCCCCCATGCCCATTGGAGGAGCA 2327 



2268 



2213 



2272 



AGCT C CT T GT CAGCT ACCAGGAGAT CC CCTTTTAT C ACAT CTGGAAT GGC AC GCAGC GGT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I 
2328 AGCT GCT GGC CAAAT ACCAGGAGAT CC CCTTCTAT C ACATTTGGAGT GGC AGCCAGAAGG 2387 

2273 AC TT GC ACTGCAC CTT CACCCT GGAGC GT GTCAGCC CC AGC ACTAGTGAC CT GGC CT GCA 2332 

I I I I I I I I I I I I I I I I I I I I I I I II I I III I I I I I II I I I 

2388 C C CT CCACTGC ACT TT CAC CCT GGAGAGGCACAGCT T GGC CT CCACAGAGCT CACCT GCA 2447 



2333 



2392 



AGCT GT GGGT GT GGC AGGT GGAGGGC GACGGGCAGAGCT T CAGCAT CAACTTCAACAT C A 
I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I II I 

2448 AGATCTGCGTGCGGCAAGTGGAAGGGGAGGGCCAGATATTCCAGCTGCATACCACTCTGG 2507 

2393 CCAAG GACACAAGGTTTGCTGAGCTGCTGGCT CT GGAGAGT GAAGC GGGGGT CCCAG 2449 

IN III II II I II I I I I 

2508 CAGAGACACCT GCT GGCT CCCT GGACACT CTCT GCT CT GCCCCT GGC AGC ACTGT CACCA 2567 

2450 CCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCA 2509 
I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
CCCAGCT GGGACCT T AT GCCTT CAAGAT C C CACT GT CCAT C CGC CAGAAGAT AT GCAACA 2627 



2569 



2568 



2510 GCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACC 

I I M I I I I I I I I II I I I I I I I II I I I II I I I I I I I I 

2628 GCCTAGATGCCCCCAACTCACGGGGCAATGACTGGCGGATGTTAGCACAGAAGCTCTCTA 2687 

2570 TGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACC 2629 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I III 
2688 TGGACCGGTACCTGAATTACTTTGCCACCAAAGCGAGCCCCACGGGTGTGATCCTGGACC 2747 

2630 TGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTG 2689 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II III I 

2748 TCTGGGAAGCTCTGCAGCAGGACGATGGGGACCTCAACAGCCTGGCGAGTGCCTTGGAGG 2807 
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Db 



2690 GACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2742 

I I I I I I I M I I I I I I I I I I I I I I 

2808 AGAT GGGCAAGAGT GAGAT GCTGGT GGCT GT GGC CACCGAC GGGGACT GCT GA 2860 
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Query Match 34.0%; Score 936.2; DB 17; Length 2860; 

Best Local Similarity 61.7%; Pred. No. 3.6e-230; 

Matches 1662; Conservative 0; Mismatches 938; Indels 93; Gaps 7; 

Qy 143 ACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATG 202 

III III II I I I I I I I I I I I I I I II I I I I I I I I Mill 

Db 168 ACTCCTTCCCGTCAGCGCCAGCAGAGCCGCTGCCCTACTTCCTGCAGGAGCCACAGGACG 227 

Qy 203 TGT ACAT CGT CAAGAACAAGCCAGT GCT GCTT GT GT GCAAGGC C GT GCC CGCCACGCAGA 262 

I I I I I I I I I I I I II I I I I I I I I I I I Ml I I I I I I I I II I I II I I 
Db 228 CCTACATTGTGAAGAACAAGCCTGTGGAGCTTCGCTGCCGCGCCTTCCCCGCCACACAGA 287 

Qy 263 T CTT CTT CAAGT GCAAC GGGGAGT GGGT GCGC CAGGT GGACCAC GT GAT C GAGCGCAGCA 322 

I I I I M I I I I I I I I I I I I I I II I M I I I I II MINIMI M II 
Db 288 TCTACTT CAAGT GCAACGGCGAGT GGGT CAGCCAGAACGAC CACGT CACACAGGAAGGCC 347 

Qy 323 CAGACGGGAGC AGT GGGCTGCCCAC CAT GGAGGT C CGC ATTAAT GT CT CAAGGCAGCAGG 382 

I I I I II I I I I I I I I I I I I M I I I I I I I II I I I I I 

Db 348 TGGATGAGGCCACCGGCCTGCGGGTGCGCGAGGTGCAGATCGAGGTGTCGCGGCAGCAGG 407 

Qy 383 TCGAGAAGGTGTTCGGGCTGGAGGAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGG 4 42 

I III M I II I I I I I I II I II I I I II I I I I I II I I I I I II I I I I II I II I I I 
Db 408 TGGAGGAGCTCTTTGGGCTGGAGGATTACTGGTGCCAGTGCGTGGCCTGGAGCTCCGCAG 4 67 

Qy 443 GC AC CACCAAGAGT CAGAAGGCCT ACAT C C GCAT AGCCAGATT GC GCAAGAACTT CGAGC 502 

I II I I I I I II I I I II MUM I II I I M Ml I II I I I M M I I I I II I 

Db 468 GC AC CACCAAGAGT CGC C GAGCCT ACGT CC GCAT CGCCT ACCT GCGCAAGAACTT C GAT C 527 

Qy 503 AGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCAC 562 

M I II I I II I I I II II M I II I M M II II I I Mill I I I M II I 

Db 52 8 AGGAGCCTCTGGGCAAGGAGGTGCCCCTGGACCATGAGGTTCTCCTGCAGTGCCGCCCGC 587 

Qy 563 CGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGT 622 

II I M M llll M M M I M II I I I I II I II M I I I I I I II II 

Db 588 C GGAGGGGGT GCCT GT GGCC GAGGT GGAAT GGCT CAAGAAT GAGGATGT CAT C GACC C CA 647 

Qy 623 CCCTGGACCCCAATGTATACATCACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCC 682 

III MM Mil I I I II II I II I I II I I II I II I II I I II 

Db 648 CCCAGGACACCAACTTCCTGCTCACCATCGACCACAACCTCATCATCCGCCAGGCCCGCC 707 

Qy 683 TTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCG 742 

I I II I II II I II II I I I II M I II I I II I I II II M II I M Mill III 

Db 7 08 TGT CGGACACT GCCAACT AT AC CT GCGT GGCCAAGAAC AT CGT GGCCAAAC GCCGGAGCA 767 

Qy 743 CCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCG 802 

Mill I M M I II II II II II II II II I II II I M I I II M II II 
Db 768 CCACTGCCACCGTCATCGTCTACGTGAATGGCGGCTGGTCCAGCTGGGCAGAGTGGTCAC 827 

Qy 803 TCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGG 862 

llll I I I I I I I I I I I I I I I I II I I I I I I I M I I I I I I I I II I M I I I 

Db 828 CCTGCTCCAACCGCTGTGGCCGAGGCTGGCAGAAGCGCACCCGGACCTGCACCAACCCCG 887 

Qy 863 CGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCA 922' 

I M Mill III II I I III II I I III III Mill M M I II I II II I 

Db 888 CTCCACTCAACGGAGGGGCCTTCTGCGAGGGCCAGGCATTCCAGAAGACCGCCTGCACCA 947 
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923 



948 



983 



CCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGG 982 
I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

CCAT CTGCC CAGT CGAT GG GGC GT GGACGGAGT GGAGCAAGT GGT C AGCCT GC AGCACT G 1007 



ACT GCAC CCACT GGCGGAGCC GT GAGT GCT CT GAC CCAGCAC CC C GCAAC GGAGGGGAGG 1042 

III I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
1008 AGTGTGCCCACTGGCGTAGCCGCGAGTGCATGGCGCCCCCACCCCAGAACGGAGGCCGTG 1067 

1043 AGTGCCAGGGCACTGACCTGGACACCCGCAACTGTACCAGTGACCTCTGTGTACACAGTG 1102 

I I I I I I I I I I I I I I I I I I I I I II I I I I III I 

1068 ACT GCAGCGGGACGCT GCT C GACT CTAAGAACT GC ACAGAT GGGCT GT GC AT GCAACT GG 1127 

1103 CTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGG 1162 

I I I I I I I I I I I I I I I III I I I I 

1128 AGGCCTCAGGGGATGCGGCGCTGTATGCGGGGCTCGTGGTGGCCATCTTCGTGGTCGTGG 1187 



1163 



1222 



TCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAG 
III II II I I I I I I I I I I I I I I I I I I I I 

1188 CAATCCTCATGGCGGTGGGGGTGGTGGTGTACCGCCGCAACTGCCGTGACTTCGACACAG 1247 

1223 AT GT GGCT GACT C GT C CAT T CTCACCTCAGGCTTCCAGCCCGTCAGCATCAAGCCCA 1279 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1248 ACAT CACT GACT C AT CTGCT GC C CT GACT GGT GGT TT C CAC C CC GTCAACT TTAAGAC GG 1307 

1280 GCAAAGCAGACAACCCCCATCT GCT CACCATCCAGCCGGACCTCAGCACCACCA 1333 

I I II I I I I I I I I I II II I I I I I I I I I I I I 

1308 CAAGGCCCAGTAACCCGCAGCTCCTACACCCCTCTGTGCCTCCTGACCTGACAGCCAGCG 1367 

1334 CCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAGGA 1370 

II I I I I I I I II I I I I I I I I I I I I 

1368 CCGGCATCTACCGCGGACCCGTGTATGCCCTGCAGGACTCCACCGACAAAATCCCCATGA 1427 

1371 TGGGCCCAGCCCCAAGTTCCAGCTCACCA 1399 

I I I I I I I I I I I I I I I I II 
142 8 CCAACTCTCCTCTGCTGGACCCCTTACCCAGCCTTAAGGTCAAGGTCTACAGCTCCAGCA 1487 

1400 — ATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACAC ACTGCACC 1447 

I I I I I I I I I I I I I I I I I I I I III 

1488 CCACGGGCTCTGGGCCAGGCCTGGCAGATGGGGCTGACCTGCTGGGGGTCTTGCCGCCTG 1547 

1448 ACAGCT CT C C CAC CT CT GAGGC C GAGGAGT TCGTCTCCC GC CTCT CCACCCAGAACT ACT 1507 

I I I I I I I I I I I I I I I I I I I I I I II 

1548 GCACATACCCTAGCGATTTCGCCCGGGACACCCACTTCCTGCACCTGCGCAGCGCCAGCC 1607 

1508 TCCGCTC C CT GC CC CGAGGCACCAGCAACAT GACCT AT GGGACCT 1552 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

1608 TCGGTTCCCAGCAGCTCTTGGGCCTGCCCCGAGACCCAGGGAGCAGCGTCAGCGGCACCT 1667 



1553 



1612 



TCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1668 TTGGCTGCCTGGGTGGGAGGCTCAGCATCCCCGGCACAGGGGTCAGCTTGCTGGTGCCCA 1727 

1613 C AGATGC CATAC C CC GAGGGAAGAT CT AT GAGAT CT AC CTCACGCT GC ACAAGC C GGAAG 1672 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1728 ATGGAGC CAT T C C C C AGGGCAAGT T CT AC GAGAT GT AT CT ACT CATCAACAAGGCAGAAA 1787 



Qy 1673 AC GTGAGGTTGCC CCT AGCT GGCT GT C AGAC CCTGCT GAGT C C CAT CGTTAGCT GT GG AC 1732 

I II II II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1788 GT ACC CTGC CGCTTT CAGAAGGGACC CAGACAGT ATT GAGCC CCT C GGT GACCT GT GGAC 1847 

Qy 1733 CCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCA 1792 

I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II 
Db 1848 CCACAGGCCTCCTGCTGTGCCGCCCCGTCATCCTCACCATGCCCCACTGTGCCGAAGTCA 1907 

Qy 1793 GCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATG 1852 

I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 1908 GTGCCCGTGACTGGATCTTTCAGCTCAAGACCCAGGCCCACCAGGGCCACTGGGAGGAGG 1967 

Qy 1853 TGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTG 1912 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1968 TGGTGACC CT GGAT GAGGAGAC C CT GAACACACC CT GCT ACT GCCAGCT GGAGCCCAGGG 2027 

Qy 1913 CCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCG 1972 

I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I 

Db 2028 CCTGTCACATCCTGCTGGACCAGCTGGGCACCTACGTGTTCACGGGCGAGTCCTATTCCC 2087 

Qy 1973 TGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCG 2032 

I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I 

Db 2088 GCTCAGCAGTCAAGCGGCTCCAGCTGGCCGTCTTCGCCCCCGCCCTCTGCACCTCCCTGG 2147 

Qy 2033 AGTACAACAT C C GGGT CT ACT GCCT GCATGACACCC ACGAT GC ACT CAAGGAGGT GGT GC 2092 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I II 
Db 2148 AGT AC AGC CT C C GGGT CT ACT GCCT GGAGGACAC GCCTGT AGCACT GAAGGAGGT GCT GG 2207 

Qy 2093 AGCTGGAGAAGCAGCT GGGGGGACAGCT GAT CC AGGAGCCACGGGT C CT GCACTT CAAGG 2152 

I I I I II I I I I I I II I II I III I I I I II I II I I I I I I I 

Db 2208 AGCTGGAGCGGACTCTGGGCGGATACTTGGTGGAGGAGCCGAAACCGCTAATGTTCAAGG 2267 

Qy 2153 AC AGT T ACCACAAC CT GC GC CTAT C CAT CCACGATGT GC CC AGCT C C CT GT GGAAGAGT A 2212 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I II I I I I I 

Db 2268 AC AGTT AC CACAAC CT GC GC CT CT C CCT CC ATGACCT CCCCC AT GC C C ATT GGAGGAGCA 2327 

Qy 2213 AGCTC CTT GT C AGCT AC C AGGAGAT C C C CTT TT ATCAC AT CT GGAAT GGCACGCAGC GGT 2272 

I I I I II I II I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I III I 

Db 2328 AGCT GCT GGCCAAAT ACC AGGAGAT CCC CT T CT ATCAC ATTT GGAGT GGCAGC CAGAAGG 2387 

Qy 2273 ACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCA 2332 

I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I 

Db 2388 CCCTC C ACT GC ACTTT CAC CCT GGAGAGGC ACAGCTT GGC CT CCACAGAGCT CACCT GCA 2447 

Qy 2333 AGCT GT GGGT GT GGCAGGT GGAGGGCGACGGGCAGAGCTT CAGCAT CAACTT CAACAT CA 2392 

II I II III I I I I I I I I I II II II I I I I III I I II I 

Db 2448 AGATCT GCGT GC GGCAAGT GGAAGGGGAGGGCCAGAT ATT CCAGCT GC AT AC CACT CT GG 2507 

Qy 2393 CCAAG GACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAG 244 9 

III III II II I II I I I I 

Db 2508 CAGAGACACCTGCTGGCTCCCTGGACACTCTCTGCTCTGCCCCTGGCAGCACTGTCACCA 2567 

Qy 2450 CCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCA 2509 

III I INI II I I I I I I || I || I II I I I II II I I I I I I I I I II 
Db 2568 CC CAGCTGGGAC CT T AT GC CT T CAAGAT CC C ACT GT C CAT C C GCCAGAAGAT AT GCAACA 2627 

Qy 2510 GCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACC 2569 



I I I I I I I I I I I I I I I I I I I I I I I I I I I! I I I I I I I I 

Db 2628 GCCT AGAT GC CC CCAACTCAC GGGGCAATGACT GGC GGAT GTT AGCACAGAAGCTCT CT A 2687 

Qy 2570 T GGACAGC CAT CT CAGCTT CTTT GCCTC CAAGC CCAGCCC CACAGCCAT GAT C CT CAACC 2629 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 2688 T GGACC GGT ACCT GAATT ACT TT GCCACCAAAGCGAGCC C CACGGGT GT GAT CCT GGACC 2747 

Qy 2630 TGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTG 2689 

I I II I I I I I I I I I I I I I I I I I I I I I I I I II III I 

Db 2748 TCTGGGAAGCTCTGCAGCAGGACGATGGGGACCTCAACAGCCTGGCGAGTGCCTTGGAGG 2807 

Qy 2690 GACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2742 

I I I I I I I II I I I I I I I I I II I I I 

Db 2808 AGAT GGGCAAGAGTGAGAT GCTGGT GGCT GT GGCCAC CGACGGGGACT GCT GA 2860 
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